Tôi đang cố gắng tìm hiểu nguồn gốc của dải tin cậy cong có liên quan đến hồi quy tuyến tính OLS và cách nó liên quan đến khoảng tin cậy của các tham số hồi quy (độ dốc và chặn), ví dụ (sử dụng R):
require(visreg)
fit <- lm(Ozone ~ Solar.R,data=airquality)
visreg(fit)
Có vẻ như băng tần có liên quan đến giới hạn của các đường được tính toán với mức chặn 2,5% và độ dốc 97,5%, cũng như với mức chặn 97,5% và độ dốc 2,5% (mặc dù không hoàn toàn):
xnew <- seq(0,400)
int <- confint(fit)
lines(xnew, (int[1,2]+int[2,1]*xnew))
lines(xnew, (int[1,1]+int[2,2]*xnew))
Điều tôi không hiểu là hai điều:
- Còn sự kết hợp giữa độ dốc 2,5% và độ chặn 2,5% cũng như độ dốc 97,5% và độ chặn 97,5% thì sao? Chúng đưa ra các dòng rõ ràng bên ngoài ban nhạc được vẽ ở trên. Có thể tôi không hiểu ý nghĩa của khoảng tin cậy, nhưng nếu trong 95% trường hợp ước tính của tôi nằm trong khoảng tin cậy, thì đây có vẻ là kết quả có thể xảy ra?
- Điều gì xác định khoảng cách tối thiểu giữa giới hạn trên và dưới (tức là gần với điểm mà hai dòng được thêm ở trên chặn)?
Tôi đoán cả hai câu hỏi phát sinh bởi vì tôi không biết / hiểu cách các dải này thực sự được tính toán.
Làm cách nào tôi có thể tính các giới hạn trên và dưới bằng cách sử dụng khoảng tin cậy của các tham số hồi quy (mà không cần dựa vào dự đoán () hoặc một hàm tương tự, tức là bằng tay)? Tôi đã cố gắng giải mã hàm dự đoán.lm trong R, nhưng mã hóa nằm ngoài tôi. Tôi đánh giá cao bất kỳ con trỏ nào đối với tài liệu hoặc giải thích phù hợp cho người mới bắt đầu thống kê.
Cảm ơn.