Tại sao R-squared của tôi quá thấp khi số liệu thống kê t của tôi quá lớn?


17

Tôi đã thực hiện hồi quy với 4 biến và tất cả đều có ý nghĩa thống kê, với các giá trị T và (tôi nói vì dường như không liên quan đến các số thập phân) rất cao và có ý nghĩa rõ ràng. Nhưng sau đó chỉ là 0,2284. Tôi có hiểu sai các giá trị t ở đây có nghĩa là một cái gì đó không? Phản ứng đầu tiên của tôi khi nhìn thấy các giá trị t là sẽ khá cao, nhưng có lẽ đó là ?7,9,2631R2R2R2


1
Tôi cá là của bạn khá lớn phải không? n
Glen_b -Reinstate Monica

@Glen_b có, khoảng 6000.
Kyle

10
Sau đó, -statistic lớn được liên kết với nhỏ là hoàn toàn không đáng kể. Vì các lỗi tiêu chuẩn giảm xuống , -ratios sẽ tăng dưới dạng , trong khi sẽ có xu hướng không đổi khi tăng . Tại sao bạn quan tâm là gì? Tại sao bạn quan tâm các tỷ số t là gì? R 2 1 / tR2 t1/nt R2nR2nR2nR2
Glen_b -Reinstate Monica

Câu trả lời:


45

Giá trị và được sử dụng để đánh giá những thứ rất khác nhau. Các giá trị được sử dụng để đánh giá tính chính xác của ước tính của bạn về , nhưng đo lường mức độ biến đổi trong biến trả lời của bạn được giải thích bởi hiệp phương sai của bạn. Giả sử bạn đang ước tính mô hình hồi quy với quan sát,tR2tβiR2n

Yi=β0+β1X1i+...+βkXki+ϵi

trong đó , .ϵii.i.dN(0,σ2)i=1,...,n

Giá trị lớn (về giá trị tuyệt đối) dẫn bạn từ chối giả thuyết null rằng . Điều này có nghĩa là bạn có thể tự tin rằng bạn đã ước tính chính xác dấu hiệu của hệ số. Ngoài ra, nếu> 4 và bạn có , thì 0 không nằm trong khoảng tin cậy 99% cho hệ số. Giá trị cho một hệ số là sự khác biệt giữa ước tính và 0 được chuẩn hóa bởi lỗi tiêu chuẩn .tβi=0|t|n>5tβiβi^se{βi^}

t=βi^se{βi^}

mà chỉ đơn giản là ước tính chia cho một thước đo độ biến thiên của nó. Nếu bạn có một tập dữ liệu đủ lớn, bạn sẽ luôn có giá trị (giá trị) có ý nghĩa thống kê . Điều này không có nghĩa là nhất thiết có nghĩa là hiệp phương sai của bạn giải thích phần lớn sự biến đổi trong biến trả lời.t

Như @Stat đã đề cập, đo lượng biến thể trong biến trả lời của bạn được giải thích bởi các biến phụ thuộc của bạn. Để biết thêm về , hãy truy cập wikipedia . Trong trường hợp của bạn, có vẻ như bạn có một bộ dữ liệu đủ lớn để ước tính chính xác các , nhưng các đồng biến của bạn làm rất kém việc giải thích và \ hoặc dự đoán các giá trị phản hồi.R2R2β iβi


1
(+1) Ngay từ đầu, rõ ràng đây là một lời giải thích được cân nhắc kỹ lưỡng.
whuber

Câu trả lời tốt đẹp. Tôi thấy các thuật ngữ "ý nghĩa thực tiễn" và "ý nghĩa thống kê" thường hữu ích trong việc suy nghĩ về vấn đề này.
Aaron - Phục hồi Monica

3
Ngoài ra còn có một phép chuyển đổi đơn giản giữa hai thống kê:R2=t2t2+df
Jeff

6

Để nói điều tương tự như caburke nhưng đơn giản hơn, bạn rất tự tin rằng phản hồi trung bình gây ra bởi các biến của bạn không phải là không. Nhưng có rất nhiều thứ khác mà bạn không có trong hồi quy khiến phản ứng nhảy xung quanh.


0

Có thể là mặc dù các yếu tố dự đoán của bạn đang có xu hướng tuyến tính theo biến phản ứng của bạn (độ dốc khác biệt đáng kể so với 0), điều này làm cho các giá trị t có ý nghĩa, nhưng bình phương R thấp vì sai số lớn, có nghĩa là độ biến thiên trong dữ liệu của bạn lớn và do đó mô hình hồi quy của bạn không phù hợp (dự đoán không chính xác)?

Chỉ 2 xu của tôi.

Có lẽ bài đăng này có thể giúp: http://blog.minitab.com/blog/adventures-in-statistic/how-to-interpret-a-regression-model-with-low-r-squared-and-low-p- giá trị


0

Một số câu trả lời được đưa ra gần nhưng vẫn sai.

"Các giá trị t được sử dụng để đánh giá tính chính xác của ước tính của bạn" là điều tôi quan tâm nhất.

Giá trị T chỉ là một dấu hiệu cho thấy khả năng xảy ra ngẫu nhiên. Lớn có nghĩa là không thể. Nhỏ có nghĩa là rất có thể. Tích cực và tiêu cực không quan trọng đối với việc giải thích khả năng.

"R2 đo lường mức độ biến đổi trong biến trả lời của bạn được giải thích bởi hiệp phương sai của bạn" là chính xác.

(Tôi đã có thể nhận xét nhưng chưa được nền tảng này cho phép.)


2
Bạn dường như viết về giá trị t như thể chúng là giá trị p.
whuber

-4

Cách duy nhất để đối phó với bình phương R nhỏ, kiểm tra như sau:

  1. Là kích thước mẫu của bạn đủ lớn? Nếu có, hãy thực hiện bước 2. nhưng nếu không, hãy tăng kích thước mẫu của bạn.
  2. Có bao nhiêu đồng biến bạn đã sử dụng cho ước tính mô hình của bạn? Nếu có nhiều hơn 1 như trong trường hợp của bạn, hãy giải quyết vấn đề đa tuyến của các hiệp phương sai hoặc đơn giản, chạy lại hồi quy và lần này không có hằng số được gọi là beta zero.

  3. Tuy nhiên, nếu vấn đề vẫn còn, sau đó thực hiện hồi quy từng bước và chọn mô hình có bình phương R cao. Nhưng điều mà tôi không thể giới thiệu cho bạn bởi vì nó mang lại sự thiên vị trong các hiệp phương sai

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.