Báo cáo kết quả của hồi quy tuyến tính đơn giản: bao gồm thông tin gì?


11

Tôi vừa thực hiện một số (rất) hồi quy tuyến tính đơn giản trong Genstat và muốn đưa vào một bản tóm tắt ngắn gọn và có ý nghĩa về đầu ra trong báo cáo của tôi. Tôi không chắc chắn chính xác những gì hoặc bao nhiêu thông tin tôi nên bao gồm.

Các bit chính của đầu ra Genstat của tôi trông như thế này:

Summary of analysis 
Source      d.f.    s.s.       m.s.       v.r.    F pr.
Regression    1   8128935.   8128935.    814.41   <.001
Residual     53    529015.      9981.        
Total        54   8657950.    160332.        

Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.

Estimates of parameters 
Parameter    estimate    s.e.     t(53)   t pr.
Constant      41.5      30.7       1.35   0.182
UKHR_Ref       0.8659    0.0303   28.54   <.001

Tôi đã dự định báo cáo điều này đơn giản là:

Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).

nhưng một đồng nghiệp đã gợi ý rằng tôi cũng nên bao gồm ít nhất root mean squared error(mà tôi tin trong trường hợp này bằng với lỗi tiêu chuẩn của các quan sát, ví dụ 99,9?).

Có bao gồm RMSE cung cấp thêm thông tin hữu ích, hoặc mức độ phù hợp đã được giải thích thỏa đáng bởi giá trị R2 được điều chỉnh?

Có những quy tắc khó và nhanh về việc báo cáo bao nhiêu thông tin, hay nó khá chủ quan?

Cảm ơn rất nhiều!


1
"Có những quy tắc khó và nhanh về việc báo cáo bao nhiêu thông tin" - nó thực sự phụ thuộc vào những gì bạn muốn làm sau khi hồi quy. Người ta có thể hài lòng với chỉ hệ số tương quan; người ta có thể cần giá trị Durbin-Watson ở trên đó, và một người khác có thể muốn xem đường chéo của ma trận mũ ... điều đó thực sự phụ thuộc.
JM không phải là một nhà thống kê

2
Một số tổ chức có quy tắc. Xem hướng dẫn APA chẳng hạn.
whuber

Câu trả lời:


6

Đối với hồi quy tuyến tính đơn giản, tôi sẽ luôn tạo ra một biểu đồ của biến x so với biến y, với dòng hồi quy được áp đặt trên biểu đồ (luôn luôn vẽ dữ liệu của bạn bất cứ khi nào khả thi!). Điều này sẽ cho bạn biết rất dễ dàng mô hình của bạn phù hợp như thế nào, và dễ đọc cho hồi quy 1 biến. Thêm vào đó những gì bạn đã có có thể là đủ, mặc dù bạn có thể muốn bao gồm một số lô chẩn đoán (đòn bẩy, khoảng cách nấu, phần dư, v.v.). Nó phụ thuộc vào mức độ tốt của cốt truyện xy và đối tượng dự định của bạn và bất kỳ giao thức nào mà khán giả của bạn mong đợi.

R2 so với RMSE

R2 là một thước đo tương đối, trong khi RMSE là một thước đo tuyệt đối, vì bạn mong đợi hầu hết các quan sát sẽ nằm trong RMSE từ đường được trang bị, và gần như tất cả nằm trong RMSE. Nếu bạn muốn truyền đạt "sức mạnh giải thích" có lẽ tốt hơn và nếu bạn muốn truyền tải "sức mạnh dự đoán", RMSE có lẽ tốt hơn.±±2R2


Cảm ơn @probabilityislogic. Tôi đã bao gồm một âm mưu trong báo cáo của mình và có vẻ như điều đó cộng với câu gốc của tôi là đủ trong trường hợp này. Tôi nghĩ rằng bao gồm các lô chẩn đoán có thể không cần thiết cho đối tượng này, mặc dù rõ ràng tôi đã tự kiểm tra chúng và chúng có vẻ hợp lý. Cũng cảm ơn vì lời giải thích của R2 so với RMSE - nó rất hữu ích.
JamesS

Giá trị t (s) và df (s) thì sao? Khi nào nên được bao gồm? Nó chỉ có ý nghĩa để bao gồm cả hai hoặc không?
hấp dẫn về natty

1

Tôi sử dụng để báo cáo hệ số plus cộng với 95% CI, giá trị p và giá trị điều chỉnh. Ví dụ:

(= 1,46, KTC 95% [1,19, 1,8], p = 0,001 **, R2 điều chỉnh = 0,48)

Nếu báo cáo hồi quy bội hoặc hồi quy với các biến nhân tố, tôi báo cáo hệ số, CI 95%, các giá trị p và sau đó tách riêng các thống kê F (độ tự do), R2 điều chỉnh và giá trị p của mô hình.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.