Shrunken


22

Trong đầu tôi đã có một số nhầm lẫn về hai loại công cụ ước tính giá trị dân số của hệ số tương quan Pearson.

A. Fisher (1915) đã chỉ ra rằng đối với hai biến dân bình thường thực nghiệm là một thiên vị tiêu cực đến mức ước lượng ρ , mặc dù xu hướng có thể số tiền thực tế đáng kể chỉ cho cỡ mẫu nhỏ ( n < 30 ). Mẫu đánh giá thấp theo nghĩa gần với hơn . (Ngoại trừ khi cái sau là hoặc , thì không thiên vị.) Một số ước tính gần như không thiên vị của đã được đề xuất, cái tốt nhất có lẽ làrρn<30rρ0ρ0±1rρOlkin và Pratt (1958) đã sửa :r

runbiased=r[1+1r22(n3)]

B. Người ta nói rằng trong hồi quy quan sát thấy đánh giá quá cao dân số R bình phương tương ứng. Hoặc, với hồi quy đơn giản, đó là r 2 đánh giá quá cao ρ 2 . Dựa trên thực tế đó, tôi đã nhìn thấy nhiều văn bản nói rằng rtích cực thiên vị tương đối để ρ , có nghĩa là giá trị tuyệt đối: r là xa hơn từ 0 hơn ρ (? Là tuyên bố true). Các văn bản nói rằng đó là vấn đề tương tự như ước tính quá mức của tham số độ lệch chuẩn theo giá trị mẫu của nó. Tồn tại nhiều công thức để "điều chỉnh" quan sát R 2R2r2ρ2rρr0ρR2Gần hơn với thông số dân số của nó, W 2ry (1931) là nổi tiếng nhất (nhưng không phải là tốt nhất). Thư mục gốc của ví dụ điều chỉnh r 2 adj được gọi là teo r :Radj2radj2 r

rshrunk=±1(1r2)n1n2

Hiện nay là hai ước lượng khác nhau của . Rất khác nhau: cái thứ nhất phồng lên r , cái thứ hai xì hơi r . Làm thế nào để hòa giải chúng? Nơi để sử dụng / báo cáo một và ở đâu - khác?ρrr

Cụ thể, có thể đúng là công cụ ước tính "thu nhỏ" (gần như) không thiên vị, giống như "không thiên vị", nhưng chỉ trong bối cảnh khác nhau - trong bối cảnh hồi quy không đối xứng. Vì, trong hồi quy OLS, chúng ta coi các giá trị của một bên (bộ dự đoán) là cố định, tham dự mà không có lỗi ngẫu nhiên từ mẫu này đến mẫu khác? (Và để thêm vào đây, hồi quy không cần tính quy tắc hai biến .)


Tôi tự hỏi nếu điều này chỉ xảy ra với một cái gì đó dựa trên sự bất bình đẳng của Jensen. Điều đó, và tính chuẩn tắc bivariate có lẽ là một giả định xấu trong hầu hết các trường hợp.
Shadowtalker

1
Ngoài ra, sự hiểu biết của tôi về vấn đề ở B. là hồi quy là một sự đánh giá quá cao bởi vì sự phù hợp hồi quy có thể được cải thiện tùy ý bằng cách thêm các yếu tố dự đoán. Điều đó đối với tôi không giống như vấn đề tương tự như trong A.r2
Shadowtalker

Có thật là là ước tính sai lệch dương của ρ 2 cho tất cả các giá trị của ρ ? Đối với phân phối chuẩn hai biến này dường như không phải là trường hợp cho ρ đủ lớn. r2ρ2ρρ
NRH

Có thể thiên vị đi theo hướng ngược lại cho bình phương của một công cụ ước tính? Ví dụ, với một ước lượng đơn giản hơn, nó có thể được chỉ ra rằng đối với một số phạm vi của θ ? Tôi nghĩ rằng đây sẽ là khó khăn để làm nếu θ = ρ , nhưng có lẽ là một ví dụ đơn giản có thể làm việc ra. E[θ^θ]<0<E[θ^2θ2]θθ=ρ
Anthony

Câu trả lời:


1

Về độ lệch trong tương quan: Khi kích thước mẫu đủ nhỏ để độ lệch có bất kỳ ý nghĩa thực tế nào (ví dụ: n <30 bạn đề xuất), thì độ lệch có thể là điều ít lo lắng nhất của bạn, bởi vì độ chính xác là rất tệ.

Về độ lệch của R 2 trong hồi quy bội, có nhiều điều chỉnh khác nhau liên quan đến ước lượng dân số không thiên vị so với ước lượng không thiên vị trong một mẫu độc lập có kích thước bằng nhau. Xem Yin, P. & Fan, X. (2001). Ước tính co rút R 2 trong hồi quy bội: So sánh các phương pháp phân tích. Tạp chí giáo dục thực nghiệm, 69, 203-224.

Các phương pháp hồi quy hiện đại cũng giải quyết sự co lại của các hệ số hồi quy cũng như R 2 do hậu quả - ví dụ, mạng đàn hồi có xác nhận chéo k- Fold, xem http://web.stanford.edu/~hastie/Papers/ thunnet.pdf .


1
Tôi không biết nếu điều này thực sự trả lời câu hỏi
Shadowtalker

1

Tôi nghĩ rằng câu trả lời là trong bối cảnh hồi quy đơn giản và hồi quy bội. Trong hồi quy đơn giản với một IV và một DV, R sq không bị sai lệch dương, và trên thực tế có thể bị sai lệch âm cho r là sai lệch âm. Nhưng trong hồi quy bội với một số IV có thể tương quan với nhau, R sq có thể bị sai lệch tích cực vì bất kỳ "triệt tiêu" nào có thể xảy ra. Do đó, tôi nghĩ rằng R2 đã đánh giá quá cao dân số R bình phương tương ứng, nhưng chỉ trong hồi quy bội


1
R sq is not positively biased, and in-fact may be negatively biasedHấp dẫn. Bạn có thể hiển thị nó hoặc đưa ra một tài liệu tham khảo? - Trong dân số bình thường bivariate, thống kê mẫu Rq có thể quan sát được là ước lượng sai lệch âm?
ttnphns

Tôi nghĩ rằng bạn là sai. Bạn có thể đưa ra một tài liệu tham khảo để sao lưu yêu cầu của bạn?
Richard Hardy

Xin lỗi, nhưng đây là một bài tập suy nghĩ nhiều hơn, vì vậy tôi không có tài liệu tham khảo.
Đinh lăng

Tôi đã đi ra khỏi Nhận xét A ở trên, trong đó Fischer đã chỉ ra rằng trong một tình huống bình thường hai biến, r là một ước lượng sai lệch âm của rho. Nếu đó là trường hợp nó sẽ không theo R sq cũng bị sai lệch tiêu cực?
Đinh lăng

Có lẽ điều này sẽ hỗ trợ trong cuộc trò chuyện digitalcommons.unf.edu/cgi/
Kẻ
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.