Ước tính không thiên vị của dân số R-vuông là gì?


14

Tôi quan tâm đến việc ước tính không thiên vị của R2 trong hồi quy tuyến tính đa biến.

Khi phản ánh, tôi có thể nghĩ về hai giá trị khác nhau mà ước tính không thiên vị của có thể đang cố khớp.R2

  1. Trong mẫu : bìnhR2 phương r sẽ thu được nếu phương trình hồi quy thu được từ mẫu (nghĩa là ) được áp dụng cho một lượng dữ liệu vô hạn bên ngoài mẫu nhưng từ cùng một dữ liệu tạo ra quá trình.β^
  2. Dân số :R2 Các r vuông đó sẽ thu được nếu một mẫu vô hạn đã thu được và mô hình lắp cho rằng mẫu vô hạn (ví dụ, ) hoặc cách khác chỉ là R-square ngụ ý bởi các dữ liệu được biết đến quá trình tạo ra.β

Tôi hiểu rằng R 2 đã điều chỉnhR2 được thiết kế để bù cho mức quá mức quan sát được trong mẫu . Tuy nhiên, không rõ liệu R 2 đã điều chỉnh có thực sự là ước tính không thiên vị của hay không và nếu đó là ước tính không thiên vị, thì trong hai định nghĩa trên của nó đang hướng tới ước tính.R2R2R2R2

Vì vậy, câu hỏi của tôi:

  • Ước tính không thiên vị về những gì tôi gọi ở trên trong mẫu gì?R2
  • Ước tính không thiên vị của những gì tôi gọi là dân số gì?R2
  • Có bất kỳ tài liệu tham khảo nào cung cấp mô phỏng hoặc bằng chứng khác về tính không thiên vị?

Câu hỏi công thức nào cho adj. R ^ 2 ít sai lệch đã được nêu ra, ví dụ ở đây .
ttnphns

Cảm ơn. Bây giờ tôi đang đọc tài liệu tham khảo mà bạn đề cập: Yin, P., & Fan, X. (2001). Ước tính co rút trong nhiều hồi quy: So sánh các phương pháp phân tích khác nhau. Tạp chí giáo dục thực nghiệm, 69 (2), 203-224. R2
Jeromy Anglim

Câu trả lời:


14

Đánh giá các điều chỉnh phân tích cho R-vuông

@ttnphns đã giới thiệu cho tôi bài viết về Yin và Fan (2001) so sánh các phương pháp phân tích khác nhau để ước tính . Theo câu hỏi của tôi, họ phân biệt giữa hai loại công cụ ước tính. Họ sử dụng thuật ngữ sau:R2

  • : Ước tính dân số bình phương hệ số tương quan nhiềuρ2
  • : Ước tính dân số bình phương hệ số chéo hiệu lựcρc2

Kết quả của họ được tóm tắt trong bản tóm tắt:

Các tác giả đã thực hiện một thí nghiệm ở Monte Carlo để nghiên cứu tính hiệu quả của các công thức phân tích để ước tính độ co rút , với 4 yếu tố được giao nhau hoàn toàn (bình phương hệ số tương quan, số lượng dự đoán, cỡ mẫu và mức độ đa hình) tế bào. Kết quả chỉ ra rằng công thức Wherry được sử dụng rộng rãi nhất (trong cả SAS và SPSS) có lẽ không phải là công thức phân tích hiệu quả nhất để ước tính ρ 2 . Thay vào đó, công thức Pratt và công thức Browne vượt trội hơn so với các công thức phân tích khác khi ước tính ρ 2ρ 2 c , tương ứng.R2ρ2ρ2ρc2

Do đó, bài viết ngụ ý rằng công thức Pratt (tr.209) là một lựa chọn tốt để ước tính :ρ2

R^2=1(N3)(1R2)(Np1)[1+2(1R2)Np2.3]

Trong đó N là cỡ mẫu và p là số lượng dự đoán.

Ước tính thực nghiệm điều chỉnh cho R-vuông

Kromrey và Hines (1995) xem xét ước tính thực nghiệm về (ví dụ: phương pháp xác nhận chéo). Chúng cho thấy các thuật toán như vậy là không phù hợp để ước tính ρ 2 . Điều này có ý nghĩa khi các thuật toán như vậy dường như được thiết kế để ước tính ρ 2 c . Tuy nhiên, sau khi đọc điều này, tôi vẫn không chắc liệu một số dạng ước tính thực nghiệm được sửa một cách thích hợp có thể vẫn hoạt động tốt hơn so với ước tính phân tích khi ước tính ρ 2 hay không .R2ρ2ρc2ρ2

Người giới thiệu

  • Kromrey, JD, & Hines, CV (1995). Sử dụng các ước tính thực nghiệm về co ngót trong hồi quy bội: một sự thận trọng. Đo lường giáo dục và tâm lý, 55 (6), 901-925.
  • R2
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.