Công thức chính xác được sử dụng trong R lm()
cho bình phương R đã điều chỉnh là gì? Làm thế nào tôi có thể giải thích nó?
Công thức r bình phương điều chỉnh
Dường như tồn tại một số công thức để tính bình phương R đã điều chỉnh.
- Công thức của Wherry:
- Công thức của McNemar:
- Công thức của Chúa:
- Công thức của Stein:
Mô tả sách giáo khoa
- Theo sách giáo khoa của Field, Khám phá thống kê sử dụng R (2012, trang 273) R sử dụng phương trình của Wherry, "cho chúng ta biết mức độ chênh lệch trong Y sẽ được tính nếu mô hình được lấy từ dân số mà mẫu được lấy". Anh ta không đưa ra công thức cho Wherry. Ông khuyến nghị sử dụng công thức của Stein (bằng tay) để kiểm tra mức độ hợp lệ của mô hình.
- Kleiber / Zeileis, Kinh tế lượng ứng dụng với R (2008, trang 59) khẳng định đó là "Bình phương R đã điều chỉnh" và không nói chính xác cách giải thích của nó thay đổi so với nhiều bình phương R.
- Dalgaard, Số liệu thống kê giới thiệu với R (2008, trang 113) viết rằng "nếu bạn nhân [bình phương R đã điều chỉnh] với 100%, nó có thể được hiểu là '% giảm phương sai'". Ông không nói công thức này tương ứng.
Trước đây tôi đã nghĩ và đọc rộng rãi rằng R bình phương bị phạt vì đã thêm các biến bổ sung vào mô hình. Bây giờ việc sử dụng các công thức khác nhau này dường như kêu gọi các cách hiểu khác nhau. Tôi cũng đã xem xét một câu hỏi liên quan về Stack Overflow ( Sự khác biệt giữa nhiều bình phương R và bình phương R điều chỉnh trong hồi quy bình phương tối thiểu một biến thiên là gì? ), Và từ điển thống kê của trường Wharton tại UPenn .
Câu hỏi
- Công thức nào được sử dụng để điều chỉnh r-vuông bằng R
lm()
? - Làm thế nào tôi có thể giải thích nó?
ans$adj.r.squared <- 1 - (1 - ans$r.squared) * ((n - df.int)/rdf)
, trong đó ans $ r.squared = R ^ 2; n = n, rdf = dư df, df.int = chặn df (0 hoặc 1).