Trong đầu tôi đã có một số nhầm lẫn về hai loại công cụ ước tính giá trị dân số của hệ số tương quan Pearson.
A. Fisher (1915) đã chỉ ra rằng đối với hai biến dân bình thường thực nghiệm là một thiên vị tiêu cực đến mức ước lượng ρ , mặc dù xu hướng có thể số tiền thực tế đáng kể chỉ cho cỡ mẫu nhỏ ( n < 30 ). Mẫu đánh giá thấp theo nghĩa gần với hơn . (Ngoại trừ khi cái sau là hoặc , thì không thiên vị.) Một số ước tính gần như không thiên vị của đã được đề xuất, cái tốt nhất có lẽ làOlkin và Pratt (1958) đã sửa :
B. Người ta nói rằng trong hồi quy quan sát thấy đánh giá quá cao dân số R bình phương tương ứng. Hoặc, với hồi quy đơn giản, đó là r 2 đánh giá quá cao ρ 2 . Dựa trên thực tế đó, tôi đã nhìn thấy nhiều văn bản nói rằng r là tích cực thiên vị tương đối để ρ , có nghĩa là giá trị tuyệt đối: r là xa hơn từ 0 hơn ρ (? Là tuyên bố true). Các văn bản nói rằng đó là vấn đề tương tự như ước tính quá mức của tham số độ lệch chuẩn theo giá trị mẫu của nó. Tồn tại nhiều công thức để "điều chỉnh" quan sát R 2Gần hơn với thông số dân số của nó, W 2ry (1931) là nổi tiếng nhất (nhưng không phải là tốt nhất). Thư mục gốc của ví dụ điều chỉnh r 2 adj được gọi là teo r :
Hiện nay là hai ước lượng khác nhau của . Rất khác nhau: cái thứ nhất phồng lên r , cái thứ hai xì hơi r . Làm thế nào để hòa giải chúng? Nơi để sử dụng / báo cáo một và ở đâu - khác?
Cụ thể, có thể đúng là công cụ ước tính "thu nhỏ" (gần như) không thiên vị, giống như "không thiên vị", nhưng chỉ trong bối cảnh khác nhau - trong bối cảnh hồi quy không đối xứng. Vì, trong hồi quy OLS, chúng ta coi các giá trị của một bên (bộ dự đoán) là cố định, tham dự mà không có lỗi ngẫu nhiên từ mẫu này đến mẫu khác? (Và để thêm vào đây, hồi quy không cần tính quy tắc hai biến .)