Công thức cho khoảng tin cậy 95% cho


13

Tôi đã googled và tìm kiếm trên stats.stackexchange nhưng tôi không thể tìm thấy công thức để tính khoảng tin cậy 95% cho giá trị cho hồi quy tuyến tính. Bất cứ ai có thể cung cấp nó?R2

Thậm chí tốt hơn, giả sử tôi đã chạy hồi quy tuyến tính bên dưới trong R. Làm cách nào để tính khoảng tin cậy 95% cho giá trị bằng mã R.R2

lm_mtcars <- lm(mpg ~ wt, mtcars)

1
Bạn có biết mối quan hệ giữa tương quan R 2 là bạn bình phương hệ số tương quan để có R 2, vậy tại sao không tính khoảng tin cậy cho r và sau đó bình phương giới hạn dưới và trên của khoảng? rR2R2r

1
@ZERO: sẽ hoạt động trong một hồi quy tuyến tính đơn giản, nghĩa là, với một công cụ dự đoán duy nhất và đánh chặn. Nó sẽ không hoạt động cho nhiều hồi quy tuyến tính với nhiều hơn một yếu tố dự đoán.
Stephan Kolassa

@StephanKolassa, rất đúng! Tôi đoán rằng tôi đã dựa trên Rmã của anh ta , nơi chỉ có một biến hồi quy nhưng đó là một điểm rất tốt để làm rõ.


Ví dụ, bạn có thể sử dụng hàm R rất nhỏ github.com/mayer79/R-confidence-inter đạn- R- squared dựa trên các thuộc tính của phân phối F không trung tâm.
Michael M

Câu trả lời:


16

Bạn luôn có thể tự khởi động nó:

> library(boot)
> foo <- boot(mtcars,function(data,indices)
        summary(lm(mpg~wt,data[indices,]))$r.squared,R=10000)

> foo$t0
[1] 0.7528328

> quantile(foo$t,c(0.025,0.975))
     2.5%     97.5% 
0.6303133 0.8584067

Carpenter & Bithell (2000, Statistics in Medicine) cung cấp một giới thiệu dễ đọc về khoảng tin cậy bootstrapping, mặc dù không tập trung cụ thể vào .R2


1
(+1) Có thể quan tâm rằng công thức gần đúng được trích dẫn bởi @Durden, với k = 1 đưa ra khoảng ( 0,546 , 0,960 ) . Sẽ là gần như hoàn toàn chính xác nếu chúng ta bỏ yếu tố 2 nhân SE trong công thức đó! n=32k=1(0.546,0.960)2
whuber

Cũng có thể đáng lưu ý rằng bạn có thể nhận được các loại khoảng tin cậy khác (ví dụ: BCa) từ phân phối lấy mẫu bootstrap bằng cách sử dụng boot.ci().
Jeffrey Girard

6

Trong R, bạn có thể sử dụng CI.Rsq()chức năng được cung cấp bởi tâm lý học gói . Đối với công thức áp dụng, xem Cohen et al. (2003) , Phân tích đa hồi quy / tương quan ứng dụng cho khoa học hành vi , tr. 88:

SER2=4R2(1R2)2(nk1)2(n21)(n+3)

R2±2SER2


3
(1R2)R2R2nk1>60k+1đếm một lần chặn cộng với số lượng biến độc lập.) Sẽ rất hữu ích khi xem một ví dụ hoạt động được hỗ trợ bởi mô phỏng, bởi vì khoảng này trông quá rộng.
whuber

Theo Wishart (1931) công thức này không phù hợp với các bản phân phối không bình thường.
abukaj
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.