Tại sao phải báo cáo R bình phương?


8

Nếu bình phương R điều chỉnh cao hơn bình phương R, thì tại sao phần mềm thống kê lại tiếp tục báo cáo sau? Có bất kỳ tình huống khi một nhà nghiên cứu có thể thích sử dụng bình phương R thay vì bình phương R điều chỉnh?


Bạn đang đối phó với loại hồi quy nào? Nếu tôi không nhầm, đối với hồi quy tuyến tính, không có sự khác biệt giữa bình phương R và bình phương R điều chỉnh. Vì vậy, trong trường hợp này, rất thích hợp để sử dụng giá trị R bình phương đơn giản.
alesc

Một tuyến tính. Nhưng gói thống kê cung cấp cả hai biện pháp. Đó là lý do tại sao tôi tự hỏi tại sao.
Mike Senin

Theo Wiki , phương trình này hơi khác một chút ngay cả đối với hồi quy tuyến tính ( p=1). Nhưng toàn bộ điểm của bình phương R được điều chỉnh là " Việc sử dụng R2 được điều chỉnh là một nỗ lực để tính đến hiện tượng của R2 tự động và tăng đột biến khi thêm các biến giải thích bổ sung vào mô hình. ". Hồi quy tuyến tính không có bất kỳ biến giải thích bổ sung nào, bởi vì đó là loại hồi quy nguyên thủy nhất.
alesc

@alesc, tôi biết điều đó. Những gì tôi không biết là tại sao phải báo cáo cả hai giá trị.
Mike Senin

Bạn đang cố gắng chứng minh điều gì với giá trị R bình phương của bạn? Bạn có so sánh các mô hình hồi quy khác nhau? Nếu bạn so sánh các mô hình hồi quy tuyến tính và phi tuyến tính, thì sẽ hợp lý khi sử dụng bình phương R đã điều chỉnh, nếu không thì bình phương R đơn giản sẽ là đủ. Nhưng sau đó, một lần nữa, bạn cũng có thể sử dụng bình phương R đã điều chỉnh ngay cả cho hồi quy tuyến tính :) Cá nhân tôi sẽ không báo cáo cả hai giá trị. Vì vậy, chọn một số liệu và chỉ báo cáo giá trị đó (bình phương R hoặc bình phương R điều chỉnh).
alesc

Câu trả lời:


5

Ví dụ, trong các điều kiện được giải thích ở đây , đo tỷ lệ phương sai trong biến phụ thuộc được giải thích bằng hồi quy, đây là một biện pháp tự nhiên. Điều chỉnh không có giải thích này, vì nó sửa đổi giá trị .R 2 R 2R2R2R2

Vì vậy, trong khi được điều chỉnh có lợi thế không thể chối cãi là không tự động tăng khi số lượng hồi quy tăng lên, bạn phải trả giá theo cách bạn có thể diễn giải biện pháp.R2

Lưu ý Tôi không ủng hộ việc sử dụng cái này hay cái kia, chỉ đưa ra một lý do có thể cho lý do tại sao mọi người vẫn sử dụng tiêu chuẩn .R2


Câu hỏi nhanh: có lẽ đúng là Là một công cụ ước tính nhất quán của dân số trong một số điều kiện, ví dụ như một mô hình được chỉ định rõ? Sau đó, sẽ hợp lý khi báo cáo Thay cho . R 2 R 2 a d j . R 2Radj.2R2Radj.2R2
Richard Hardy

3
Có, nhưng như chúng ta có thể viết và, rõ ràng, (ít nhất là khi, như hầu hết được giả định, vẫn cố định là ), chúng ta có , do đó dường như không phải là một lý do để thích cái này hơn cái kia. n-1Radj.2=1n1nK+n1nKR2n1nK1KnRadj.2R2=op(1)
Christoph Hanck

K tất nhiên là số lượng người hồi quy
Christoph Hanck

1
Chà ... chúng ta có định nghĩa dân số là không? Nếu vậy, viết ( điều chỉnh df ước lượng phương sai chia cho ) cho thấy cả công cụ ước tính của phương sai lỗi trong tử số và phương sai của trong mẫu số đều không thiên vị cho các tham số dân số tương ứng, và . Nhưng điều đó không làm cho tỷ lệ trở thành một công cụ ước tính không thiên vị về tỷ lệ của các tham số, vì toán tử kỳ vọng không đi qua các hàm phi tuyến nói chung. R21σ2/Var(y) s2n-KyE(s2)=σ2E[Σi(y- ˉ y )2/(n-1)]=Vmộtr(y)Radj.2=1s2i(yy¯)2/(n1)s2nKyE(s2)=σ2E[i(yy¯)2/(n1)]=Var(y)
Christoph Hanck

1
Cảm ơn. Có lẽ tôi nên đăng bình luận của mình dưới dạng một câu hỏi riêng biệt, sau đó tôi có thể nêu lên câu trả lời của bạn. Vì tôi nghi ngờ những điều tương tự đã được hỏi, tôi chỉ hy vọng một xác nhận / xác nhận ngắn, kiểu nhận xét. Bạn đã rõ ràng hơn thế, tôi đánh giá cao nó!
Richard Hardy

1

Bình phương R điều chỉnh rất hữu ích để so sánh các mô hình hồi quy khác nhau. Nhiệm vụ này không thể được thực hiện bởi R bình phương, như những người khác đã nói, có một mục tiêu thông tin khác, đó là biểu thị tỷ lệ phương sai của biến phụ thuộc được giải thích bằng mô hình hồi quy đang được điều tra.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.