Giải thích khoảng dự đoán 95% Bayes


9

Giả sử mô hình hồi quy bivariate sau: trong đó là iid cho .u i N ( 0 , σ 2 = 9 ) i = 1 , ... , n

yTôi= =βxTôi+bạnTôi,
bạnTôiN(0,σ2= =9)Tôi= =1,Giáo dục,n

Giả sử một đó không phù hợp, thì có thể thấy rằng pdf sau cho là trong đóβ p ( β | y ) = ( 18 π ) - 1p(β)αkhông thay đổiβ β =(Σ n i = 1 yixi)/(Σ n i = 1 x 2 i ).

p(β|y)= =(18π)-12(ΣTôi= =1nxTôi2)12điểm kinh nghiệm[-118ΣTôi= =1nxTôi2(β-β^)2],
β^= =(ΣTôi= =1nyTôixTôi)/(ΣTôi= =1nxTôi2).

Bây giờ hãy xem xét giá trị của với giá trị tương lai đã cho là x , x_ {n + 1} : y_ {n + 1} = \ beta x_ {n + 1} + u_ {n + 1}, trong đó u_ {n + 1 } là iid N (0, \ sigma ^ 2 = 9) , sau đó chúng ta có thể chỉ ra rằng p (y_ {n + 1} | x_ {n + 1}, \ mathbf {y}) = \ int _ {\ beta} p (y_ {n + 1} | x_ {n + 1}, \ beta, \ mathbf {y}) p (\ beta | \ mathbf {y}) d \ beta là mật độ bình thường với kỳ vọng và phương sai E [y_ { n + 1} | x_ {n + 1}, \ mathbf {y}] = \ hat {\ beta} x_ {n + 1}, \ quad {\ rm var} [y_ {n + 1} | x_ {n +1}, \ mathbf {y}] = \ frac {9 [x_ {n + 1} ^ 2 + \ sum_ {i = 1} ^ n x_i ^ 2]} {\ sum_ {i = 1} ^ n x_i ^ 2}. Do đó, hàm mật độ xác suất sau cho y_ {n + 1} , có điều kiện trên x_ {n + 1} , là x x n + 1 y n + 1 = β x n + 1 + u n + 1 , u n + 1 N ( 0 , σ 2 = 9 ) p ( y n + 1 | x n + 1 , y ) = β p ( y n + 1 | x nyxxn+1

yn+1= =βxn+1+bạnn+1,
bạnn+1N(0,σ2= =9)
p(yn+1|xn+1,y)= =βp(yn+1|xn+1,β,y)p(β|y)dβ
E[yn+1|xn+1,y]= =β^xn+1,vmộtr[yn+1|xn+1,y]= =9[xn+12+ΣTôi= =1nxTôi2]ΣTôi= =1nxTôi2.
yn+1xn+1
p(yn+1|xn+1,y)= =(18π[xn+12+ΣTôi= =1nxTôi2]ΣTôi= =1nxTôi2)-12×điểm kinh nghiệm{-ΣTôi= =1nxTôi218(xn+12+ΣTôi= =1nxTôi2)(yn+1-β^xn+1)2}

Bây giờ câu hỏi là: Chỉ định khoảng dự đoán 95% cho yn+1 và cẩn thận diễn giải nó. Những khía cạnh nào của quá trình tạo dữ liệu mà khoảng thời gian không phù hợp với sự không chắc chắn của chúng ta về?


Tôi không chắc lắm về cách trả lời câu hỏi nhưng đây là nỗ lực của tôi:

Vì vậy, về cơ bản chúng ta cần tìm một số và sao chomộtbP(một<yn+1<b)= =mộtbp(yn+1|xn+1,y)dyn+1= =95%

Bây giờ chúng ta biết rằng trong đó và , do đó: yn+1|xn+1,y~N(m,v2)m= =E[yn+1|xn+1,y]v2= =vmộtr[yn+1|xn+1,y]

yn+1-mv~N(0,1)
P(-1,96<yn+1-mv<1,96)= =95%
P(-1,96v+m<yn+1<1,96v+m)= =95%

Bây giờ vì chúng ta đang điều hòa trên và nhìn vào biểu thức cho và , chúng ta thấy rằng cả và đều là các giá trị đã biết. Vậy ta có thể lấy và . tức là, chúng ta có thể chọn nhiều khả năng khác của và mang lại xác suất ... nhưng làm thế nào điều này liên quan đến việc trả lời một phần của câu hỏi hỏi những khía cạnh nào của quá trình tạo dữ liệu mà khoảng này không phù hợp?xn+1vmvmmột= =-1,96v+mb= =1,96v+mmộtb95%


1
Vui lòng thêm thẻ tự học nếu đây là bài tập về nhà hoặc cố gắng giải quyết vấn đề trong sách giáo khoa.
Nick Cox

2
@Nick Cox Cảm ơn đã thông báo cho tôi, tôi đã thêm thẻ tự học.
TeTs

Có thể là khoảng thời gian cụ thể không cung cấp cho chúng tôi bất kỳ hiểu biết về hình dạng của quá trình tạo dữ liệu? Đó là, chúng ta không biết kết hợp trung bình / phương sai chỉ từ khoảng?

Câu hỏi lạ. Có một bối cảnh trước khi tập thể dục? Tại sao bạn nói một mô hình hồi quy bivariate ?
Stéphane Laurent

Câu trả lời:


2

Khoảng thời gian chứa tất cả sự không chắc chắn trong vấn đề. Trong phần mô tả vấn đề của bạn, điều duy nhất bạn không biết là và . Khoảng dự đoán mà bạn xuất phát phù hợp với sự không chắc chắn trong cả hai điều này. Vì vậy, không có sự không chắc chắn còn lại cho khoảng "không phù hợp".βbạn


Vẫn còn sự không chắc chắn về việc liệu mô hình có đúng hay không.
Tây An

1
Mô hình được nêu là một giả định. Do đó, không có sự không chắc chắn về nó.
Tom Minka

Tôi cho rằng điều có nghĩa là phân phối dự báo đại diện cho tất cả sự không chắc chắn trong vấn đề và khoảng thời gian chỉ tóm tắt một số khía cạnh của phân phối đó. Tuy nhiên, không rõ ràng một khoảng thời gian nó để lại bất cứ điều gì.
liên hợp chiến binh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.