Khi nào R bình phương âm?


77

Hiểu biết của tôi là không thể âm vì nó là bình phương của R. Tuy nhiên tôi đã chạy hồi quy tuyến tính đơn giản trong SPSS với một biến độc lập duy nhất và một biến phụ thuộc. Đầu ra SPSS của tôi cho tôi giá trị âm cho . Nếu tôi tính toán điều này bằng tay từ R thì sẽ dương. SPSS đã làm gì để tính toán điều này là âm?R 2 R 2R2R2R2

R=-.395
R squared =-.156
B (un-standardized)=-1261.611

Mã tôi đã sử dụng:

DATASET ACTIVATE DataSet1. 
REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA 
           /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN 
           /DEPENDENT valueP /METHOD=ENTER ageP

Tôi nhận được một giá trị âm. Bất cứ ai có thể giải thích điều này có nghĩa là gì?

Tiêu cực RSquared

nhập mô tả hình ảnh ở đây


3
Điều này có trả lời câu hỏi của bạn không? stats.stackexchange.com/questions/6181/ Khăn Nếu không, xin vui lòng cung cấp thêm thông tin: đây là "đầu ra SPSS" của thủ tục gì?
whuber

2
Mô hình hồi quy tuyến tính của bạn có một đánh chặn?
NPE

2
@Anne Một lần nữa, bạn đang sử dụng thủ tục SPSS nào?
whuber

1
@Anne Tôi khuyên bạn nên bỏ qua trả lời chuỗi thời gian, vì dữ liệu của bạn không phải là chuỗi thời gian và bạn không sử dụng quy trình chuỗi thời gian. Bạn có thực sự chắc chắn rằng bình phương R được cho là giá trị âm không? Độ lớn của nó là chính xác: . Tôi đã xem qua trợ giúp của SPSS để xem có lẽ như một quy ước, giá trị bình phương R cho âm R bị phủ định hay không, nhưng tôi không thấy bất kỳ bằng chứng nào cho thấy đây là trường hợp. Có lẽ bạn có thể đăng một ảnh chụp màn hình của đầu ra mà bạn đang đọc R bình phương? (0.395)2=0.156
whuber

1
Biến phụ thuộc là giá nhà nên khả thi là 95% CI có thể là 120.000. Thật không may, tôi không thể đăng dữ liệu ở đây vì nó sẽ trái với điều kiện sử dụng dữ liệu.
Anne

Câu trả lời:


106

R 2 R 2 R 2R2 so sánh sự phù hợp của mô hình đã chọn với mô hình đường thẳng nằm ngang (giả thuyết null). Nếu mô hình được chọn phù hợp kém hơn so với đường ngang, thì là âm. Lưu ý rằng không phải luôn luôn là bình phương của bất cứ thứ gì, vì vậy nó có thể có giá trị âm mà không vi phạm bất kỳ quy tắc toán học nào. chỉ âm khi mô hình được chọn không theo xu hướng của dữ liệu, do đó, phù hợp tệ hơn so với đường ngang.R2R2R2

Ví dụ: khớp dữ liệu với mô hình hồi quy tuyến tính bị ràng buộc để chặn phải bằng .1500Y1500

nhập mô tả hình ảnh ở đây

Mô hình không có ý nghĩa gì cả với những dữ liệu này. Nó rõ ràng là mô hình sai, có lẽ được chọn ngẫu nhiên.

Sự phù hợp của mô hình (một đường thẳng bị hạn chế đi qua điểm (0,1500)) kém hơn so với sự phù hợp của đường ngang. Do đó, tổng bình phương từ mô hình lớn hơn tổng bình phương từ đường ngang . được tính là . Khi lớn hơn , phương trình đó sẽ tính giá trị âm cho .( S S tot ) R 2 1 - S S reg(SSreg)(SStot)R2 SSregSStotR21SSregSStotSSregSStotR2

Với hồi quy tuyến tính không có ràng buộc, phải dương (hoặc bằng 0) và bằng bình phương của hệ số tương quan, . Chỉ có thể có âm với hồi quy tuyến tính khi giao thoa hoặc độ dốc bị hạn chế sao cho đường "phù hợp nhất" (được đưa ra ràng buộc) khớp với đường ngang. Với hồi quy phi tuyến, có thể âm bất cứ khi nào mô hình phù hợp nhất (đưa ra phương trình đã chọn và các ràng buộc của nó, nếu có) phù hợp với dữ liệu tệ hơn đường ngang. r R 2 R 2R2rR2R2

Tóm lại: một âm không phải là một bất khả thi toán học hoặc các dấu hiệu của một lỗi máy tính. Nó đơn giản có nghĩa là mô hình được chọn (với các ràng buộc của nó) phù hợp với dữ liệu thực sự kém.R2


3
@JMS Điều đó trái ngược với những gì Google của tôi chỉ ra: "/ ORIGIN" sửa lỗi chặn ở 0; "/ NOORIGIN" "nói với SPSS không được triệt tiêu hằng số" ( Hướng dẫn giới thiệu về SPSS cho Windows )
whuber

10
@whuber Đúng. @ harvey-motulsky Giá trị R ^ 2 âm không thể tính toán (và gợi ý lỗi máy tính) cho hồi quy OLS thông thường (có chặn). Đây là những gì lệnh 'ĐĂNG KÝ' làm và những gì người đăng ban đầu đang hỏi về. Ngoài ra, đối với hồi quy OLS, R ^ 2 mối tương quan bình phương giữa các giá trị dự đoán và giá trị quan sát được. Do đó, nó phải không âm. Đối với hồi quy OLS đơn giản với một yếu tố dự báo, điều này tương đương với tương quan bình phương giữa yếu tố dự đoán và biến phụ thuộc - một lần nữa, điều này phải không âm.
Wolfgang

1
@whuber Thật vậy. Lỗi của tôi; rõ ràng là tôi không sử dụng SPSS - hoặc đọc, rõ ràng :)
JMS

1
@whuber. Tôi đã thêm một đoạn chỉ ra rằng với hồi quy tuyến tính, R2 chỉ có thể âm khi chặn (hoặc có lẽ độ dốc) bị hạn chế. Không có ràng buộc, R2 phải dương và bằng bình phương của r, hệ số tương quan.
Harvey Motulsky

1
@HarveyMotulsky, trong trường hợp này, phần chặn hoặc độ dốc không bị hạn chế. Có vẻ như bạn đang nói rằng Rupquared chỉ có thể âm nếu những điều này bị hạn chế. Bạn có thể giải thích những gì có thể xảy ra trong trường hợp cụ thể này không?
Anne

18

Bạn đã quên bao gồm một đánh chặn trong hồi quy của bạn? Tôi không quen thuộc với mã SPSS, nhưng trên trang 21 của Kinh tế lượng của Hayashi:

R2

R2=1i=1nei2i=1n(yiy¯)2

R2

Tôi sẽ kiểm tra và đảm bảo rằng SPSS bao gồm một phần chặn trong hồi quy của bạn.


4
Tiểu ban NOORIGIN trong mã của cô nói rằng việc chặn được đưa vào mô hình
ttnphns

2
lạ nhỉ. Tôi đã đoán điều đó NOORIGINcó nghĩa là việc chặn không được đưa vào mô hình, chỉ cần tắt tên.
Matt O'Brien

6

Điều này có thể xảy ra nếu bạn có chuỗi thời gian là Niid và bạn xây dựng mô hình ARIMA không phù hợp có dạng (0,1,0), là mô hình đi bộ ngẫu nhiên khác biệt đầu tiên không có sự trôi dạt sau đó phương sai (tổng bình phương - SSE) phần dư sẽ lớn hơn phương sai (tổng bình phương SSO) của chuỗi ban đầu. Do đó, phương trình 1-SSE / SSO sẽ mang lại một số âm khi SSE thực thi SSO. Chúng tôi đã thấy điều này khi người dùng chỉ cần phù hợp với một mô hình giả định hoặc sử dụng các quy trình không đầy đủ để xác định / hình thành cấu trúc ARIMA phù hợp. Thông điệp lớn hơn là một mô hình có thể làm biến dạng (giống như một cặp kính xấu) tầm nhìn của bạn. Nếu không có quyền truy cập vào dữ liệu của bạn, nếu không tôi sẽ gặp vấn đề trong việc giải thích kết quả bị lỗi của bạn. Bạn đã mang đến sự chú ý của IBM chưa?

Ý tưởng về một mô hình giả định là phản tác dụng đã được lặp lại bởi Harvey Motulsky. Bài đăng tuyệt vời Harvey!


1
thống kê Cảm ơn. Không, tôi chưa nói chuyện với IBM. Dữ liệu không phải là chuỗi thời gian. Đó là từ điểm trong dữ liệu thời gian.
Anne

5
@Anne và những người khác: Vì dữ liệu của bạn không phải là chuỗi thời gian và bạn không sử dụng quy trình chuỗi thời gian, vui lòng bỏ qua câu trả lời của tôi. Những người khác đã quan sát R Squares tiêu cực khi liên quan đến chuỗi thời gian có thể thấy bài đăng của tôi thú vị và nhiều thông tin hữu hình. Những người khác không may có thể không.
IrishStat

@IrishStat: Bạn có thể vui lòng thêm một liên kết đến bài đăng Harvey Motulsky không?
kjetil b halvorsen

Harvey trả lời câu hỏi ở đây.
IrishStat
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.