Cần lớn hơn 1?


8

Các trang Wikipedia trên R2 nói có thể đảm nhận một lớn hơn giá trị hơn 1. Tôi không thấy cách này là có thể.R2

Các giá trị của nằm ngoài phạm vi 0 đến 1 có thể xảy ra khi sử dụng nó để đo sự thỏa thuận giữa các giá trị được quan sát và mô hình hóa và ở đó các giá trị "được mô hình hóa" không thu được bằng hồi quy tuyến tính và tùy thuộc vào công thức nào của R ^ 2 được sử dụng . Nếu công thức đầu tiên ở trên được sử dụng, các giá trị có thể nhỏ hơn 0. Nếu biểu thức thứ hai được sử dụng, các giá trị có thể lớn hơn một.R 2R2R2

Câu nói đó đề cập đến "biểu thức thứ hai" nhưng tôi không thấy biểu thức thứ hai trên trang.

Có kịch bản nào mà R2 có thể lớn hơn 1 không? Tôi đang suy nghĩ về câu hỏi này cho hồi quy phi tuyến, nhưng muốn có một câu trả lời chung chung.

[Dành cho ai đó đang xem trang này với câu hỏi ngược lại: Có; R2 có thể âm. Điều này xảy ra khi bạn phù hợp với một mô hình phù hợp với dữ liệu tồi tệ hơn một đường ngang. Điều này thường là do nhầm lẫn trong việc chọn một mô hình hoặc các ràng buộc.]


6
Vấn đề này đã được xử lý ít nhất một lần trên trang web này.stackexchange.com/questions/251337 và tôi tưởng tượng rằng có nhiều câu hỏi liên quan đến nó hoặc giải thích hoàn toàn về nó. , điều này chỉ đúng khi mô hình bao gồm một chặn và nếu trung bình của lỗi / dư là 0. Nếu liên quan, đơn giản nhất , đối với mối tương quan, và không có sự điều chỉnh nào, thì nó thực sự phải không lớn hơn 1. Chỉ là nó không phải luôn luôn được tính theo cùng một cách như một mối tương quan. S S t > S S e R 2
SST(totmộttôi)= =RSS(modetôi)+SSE(error)
SSt>SSeR2
Sextus Empiricus 16/03/18

1
Vì vậy, bạn có hai biểu thức: , có thể S S m > S S t
R2= =1-SSe/SSt= =SSm/SSt
SSm>SSt
Sextus Empiricus

Tôi tính R bình phương là "1.0 - (perfect_error_variance / Dep_data_variance)" và vì phương sai lỗi tuyệt đối không thể nhỏ hơn 0, theo tính toán của tôi, giá trị tối đa của bình phương R là 1.0
James Phillips

2
Những điều kỳ quặc như thế này khiến tôi nghĩ rằng nói chung được coi là bình phương của mối tương quan giữa quan sát và dự đoán. R2
Nick Cox

Nếu R bình phương nhiều hơn một nghĩa là 1 + 1 nhiều hơn 2
Ibrahim

Câu trả lời:


8

Tôi tìm thấy câu trả lời, vì vậy sẽ đăng câu trả lời cho câu hỏi của tôi. Như Martijn đã chỉ ra, với hồi quy tuyến tính, bạn có thể tính bằng hai biểu thức tương đương:R2

R2= =1-SSe/SSt= =SSm/SSt

Với hồi quy phi tuyến, bạn không thể tính tổng bình phương của phần dư và tổng bình phương của hồi quy để có được tổng bình phương. Phương trình đó đơn giản là không đúng. Vì vậy phương trình trên là không đúng. Hai kinh nghiệm đó tính hai giá trị khác nhau cho .R2

Phương trình duy nhất có ý nghĩa và (tôi nghĩ) được sử dụng phổ biến là:

R2= =1-SSe/SSt

Giá trị của nó không bao giờ lớn hơn 1.0, nhưng nó có thể âm khi bạn khớp sai mô hình (hoặc sai các ràng buộc) vì vậy (tổng bình phương của phần dư) lớn hơn S S t (tổng bình phương của sự khác biệt giữa giá trị Y thực tế và trung bình).SSeSSt

Phương trình khác không được sử dụng với hồi quy phi tuyến:

R2= =SSm/SSt

Nhưng nếu phương trình này được sử dụng, nó dẫn đến lớn hơn 1.0 trong trường hợp mô hình phù hợp với dữ liệu thực sự kém nên S S m lớn hơn S S t . Điều này xảy ra khi sự phù hợp của mô hình kém hơn so với sự phù hợp của một đường nằm ngang, các trường hợp tương tự dẫn đến R 2 <0 với phương trình khác.R2SSmSStR2

Điểm mấu chốt: có thể lớn hơn 1.0 khi sử dụng phương trình không hợp lệ (hoặc không chuẩn) để tính R 2 và khi mô hình được chọn (với các ràng buộc, nếu có) phù hợp với dữ liệu thực sự kém, tệ hơn so với độ khớp ngang hàng.R2R2


Điểm cuối cùng có đúng không? Xem xét dữ liệu trong một dòng hoàn hảo. Bây giờ hãy xem xét một mô hình phù hợp chính xác với dòng này. Cái này có SS_m / SS_t = 1. Bây giờ hãy xem xét cùng một mô hình nhưng với độ dốc hơi dốc hơn. Bây giờ SS_m lớn hơn một chút và SS_m / SS_t> 1. Mô hình kém hơn một chút nhưng nó vẫn phù hợp với dữ liệu, không "thực sự kém".
Denziloe

@Denziloe. Dữ liệu của bạn là hoàn hảo hoặc gần như hoàn hảo với độ dốc dương. Bây giờ phù hợp với đường hồi quy tuyến tính với ràng buộc là độ dốc âm với độ dốc nhỏ hơn -100. Mô hình phù hợp sẽ phù hợp tệ hơn so với đường ngang, vì vậy SSe lớn hơn SSt. Với phương trình đầu tiên, R2 sẽ âm. Với phương trình thứ hai, R2 sẽ lớn hơn 1. Không, đó không phải là tình huống thực tế hoặc phổ biến.
Harvey Motulsky

@Denziloe. Mô hình sẽ phù hợp với dữ liệu thực sự kém (tệ hơn so với giả thuyết null của đường ngang), chỉ khi bạn hạn chế độ dốc hoặc chặn đến một giá trị không có ý nghĩa. Trong ví dụ của bạn, mô hình phù hợp với dữ liệu tốt, tốt hơn so với đường ngang phù hợp.
Harvey Motulsky

Xin lỗi, tôi không thực sự làm theo như một phản ứng. Trong ví dụ của tôi, SS_m / SS_t> +1 - bạn có đồng ý không? Và mô hình là một phù hợp tốt - một lần nữa bạn đồng ý? Điều này dường như mâu thuẫn với tuyên bố của bạn, "R2 chỉ có thể lớn hơn 1 khi ... mô hình được chọn phù hợp với dữ liệu thực sự kém".
Denziloe

@Denziloe Vui lòng gửi một số dữ liệu thực tế và phù hợp, để tôi / chúng tôi có thể thấy ý của bạn.
Harvey Motulsky

4

R2= =1-SSe/SStSSe= =0R2= =1


1
Điều này nói chung không đúng và chỉ giữ khi phương sai mô hình nhỏ hơn phương sai lỗi. Ví dụ, lấy hồi quy tuyến tính mà không có hệ số chặn.
Alex R.

R2
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.