Tôi đã đọc qua nhiều cuộc thảo luận tuyệt vời trên trang web về việc giải thích các khoảng tin cậy và khoảng dự đoán, nhưng một khái niệm vẫn còn hơi khó hiểu:
Hãy xem xét các khuôn khổ OLS và chúng tôi đã thu được những trang bị mô hình y = X β . Chúng tôi đang đưa ra một x * và hỏi để dự đoán phản ứng của nó. Chúng tôi tính toán x * T β và, như một phần thưởng, chúng tôi cũng cung cấp một khoảng thời gian dự đoán 95% xung quanh dự đoán của chúng tôi, a la Lấy một công thức cho giới hạn dự đoán trong một mô hình tuyến tính . Hãy gọi khoảng dự đoán PI này.
Bây giờ, điều nào sau đây (hoặc không) là cách giải thích chính xác về PI?
- Đối với nói riêng, y ( x ∗ ) nằm trong PI với xác suất 95%.
Từ cách diễn đạt của @ gung trong khoảng dự đoán hồi quy tuyến tính , có vẻ như điều này là đúng (mặc dù tôi rất có thể hiểu sai.) Giải thích 1 có vẻ trái ngược với tôi (theo nghĩa là chúng ta rút ra kết luận Bayes từ phân tích thường xuyên), nhưng nếu nó đúng, có phải vì chúng ta dự đoán việc thực hiện một biến ngẫu nhiên so với ước tính một tham số ?
Nỗ lực mới nhất của tôi về điều này: chúng ta có thể "phân tách một cách khái niệm" (sử dụng từ rất lỏng lẻo) một khoảng dự đoán thành hai phần: (A) một khoảng tin cậy xung quanh phản ứng trung bình dự đoán và (B) một tập hợp các khoảng chỉ là lượng tử phạm vi của thuật ngữ lỗi. (B) chúng ta có thể đưa ra các tuyên bố xác suất, có điều kiện để biết ý nghĩa dự đoán thực sự, nhưng nói chung, chúng ta chỉ có thể coi các khoảng dự đoán là các TCTD thường xuyên xung quanh các giá trị dự đoán. Điều này có phần đúng?