xác minh một hậu thế là đúng


7

Có một vấn đề bài tập về nhà trong một cuốn sách giáo khoa yêu cầu xác minh quyền sở hữu của một bản phân phối sau, và tôi gặp một chút rắc rối với nó. Thiết lập là bạn có mô hình hồi quy logistic với một yếu tố dự đoán và bạn có một bộ đồng phục không phù hợp trước .R2

Cụ thể, chúng tôi giả sử cho rằng vì vậy khả năng là Vấn đề là tôi nghi ngờ rằng hậu thế này thực sự không phù hợp.i=1,,k

yiα,β,xiBinomial(n,invlogit(α+βxi)),
p(yα,β,x)=i=1k[invlogit(α+βxi)]yi[1invlogit(α+βxi)]nyi.

Đối với tình huống cụ thể trong đó , nếu chúng ta sử dụng thay đổi biến và , thì chúng ta có thể thấy rằng Trong dòng có dấu hoa thị, chúng ta giả sử rằng , nhưng nếu không, thì chúng ta sẽ có cùng một thứ.k=1s1=invlogit(α+βx)s2=β

R2p(yα,β,x)dαdβ=R2[invlogit(α+βx)]y[1invlogit(α+βx)]nydαdβ=01s1y1(1s1)ny1ds1ds2(*)=B(y,ny)1ds2=.
0<y<n

Tôi đang làm điều gì đó ngớ ngẩn ở đây? Hay đây là một hậu thế không đúng?


2
Nhìn thoáng qua - không cần xem xét các chi tiết - tôi thấy thật kỳ lạ khi (a) bạn tích hợp trên cả hai giá trị dương và âm của β và (b) một yếu tố 1/β không xuất hiện khi bạn thay đổi biến. Có lẽ, sau đó, một chút chú ý đến các cơ chế tích hợp sẽ giải quyết vấn đề của bạn.
whuber

Tôi chưa thực hiện bất kỳ phép toán nào để sao lưu điều này, nhưng cả trực giác và trí nhớ của tôi đều nói rằng bạn đúng và rằng hậu thế không cần phải đúng. Bằng cách tương tự, nếu bạn sửa , căn hộ trước là Haldane trước, điều này không phải lúc nào cũng dẫn đến hậu thế thích hợp. β=0α
anh chàng

2
Với , bạn có thể thấy trực tiếp từ phương trình của mình về khả năng mật độ sau sẽ không đổi dọc theo các kết hợp tham số mà lấy các giá trị không đổi. Vì vậy, hậu thế thực sự không phù hợp và có hình dạng một sườn núi cho . Về cơ bản, bất kỳ đường hồi quy nào phù hợp với phản hồi quan sát tại sẽ phù hợp với dữ liệu. Nhưng với , tôi sẽ ngạc nhiên nếu hậu thế không phù hợp ngoại trừ trong các trường hợp suy biến như hoặc các trường hợp phân tách tuyến tính. k=1p(α,β|y1,x1)α+βxik=1x1k>1x1=x2
Jarle Tufto

1
@ Xi'an đó là nơi s đến từ1
Taylor

3
Giải thích của @JarleTufto là hoàn toàn chính xác: việc phân phối chỉ phụ thuộc vào , do đó không thể mang thông tin về . Do đó một hậu thế không đúng. Ngoài ra còn có một vấn đề cho nhiều quan sát hơn nếu tất cả các đều bằng hoặc tất cả bằng . Yα+βxα βyi0n
Tây An

Câu trả lời:


3

Với , bạn có thể thấy trực tiếp từ phương trình của mình về khả năng mật độ sau sẽ không đổi dọc theo các đường parallell mà tại đó lấy các giá trị không đổi. Vì vậy, hậu thế thực sự không phù hợp và có hình dạng một sườn núi cho . Về cơ bản, bất kỳ đường hồi quy nào phù hợp với phản hồi quan sát ở cũng sẽ hoạt động tốt như nhau.𝑘=1𝑝(𝛼,𝛽|𝑦1,𝑥1)𝛼+𝛽𝑥𝑖𝑘=1𝑥1

Tiếp theo, giả sử chúng ta có quan sát. Hãy xem xét việc xác định lại thông số được đưa ra bởi started Vì đây là một phép biến đổi tuyến tính của với một yếu tố quyết định không đổi trước cũng đồng nhất trên , với điều kiện là . Hãy xem xét việc tái tham số hóa thêm, phép biến đổi logit nghịch đảo cho . Rõ ràng, cũng là một tiên nghiệm độc lập với mật độ được đưa ra bởi k=2

η1=α+βx1η2=α+βx2
α,βη1,η2R2x1x2
pi=11+eηi,
i=1,2p1,p2
π(pi)=π(ηi)|dηidpi|ddpilnpi1pi=1(1pi)pi
Đây được gọi là các linh mục Haldane không đúng , có thể được hiểu là một dạng giới hạn nhất định của mật độ phân phối Beta với cả hai tham số gần bằng 0. Có điều kiện trên dữ liệu , với điều kiện , mật độ biên sau cho mỗi là các bản phân phối Beta phù hợp với các tham số . Định dạng lại, phân phối sau của và cũng phải phù hợp. Điều này giữ ngoại trừ trong các trường hợp đặc biệt như mộty1,y20<yi<npiyi,nyi(η1,η2)(α,β)yilấy giá trị 0 hoặc trong trường hợp hàm beta bình thường hóa là vô hạn và hậu thế của (và do đó, hậu thế của và ) là không chính xác.nB(yi,nyi)piαβ

Đối với các quan sát , hậu thế cũng phải phù hợp vì mật độ sau không chuẩn hóa của được giới hạn bởi hậu nghiệm dựa trên các quan sát đầu tiên .k>2α,βk=2


Tôi không chắc hai câu trả lời của chúng tôi có bất đồng về mặt toán học. Tôi đang nói tích phân là vô hạn khi mỗi và bạn đang nói tích phân là hữu hạn bất cứ khi nào tất cả nằm giữa các điểm cuối một cách nghiêm ngặt. Ngoài ra, đây có thể là một điều phụ thuộc vào người bạn hỏi, nhưng tôi có ấn tượng rằng nếu một hậu thế không phù hợp với tất cả các điểm dữ liệu có thể, thì nó được định nghĩa là "không phù hợp". Ưu tiên của Haldane là một ví dụ nơi điều này xảy ra. yi=nyi
Taylor

Nhưng bất đẳng thức của bạn nói rằng tích phân của hậu thế không chuẩn hóa (đối với bất kỳ nào ) (phía bên trái của bất đẳng thức đầu tiên) là vô hạn nên có sự bất đồng. Tôi không chắc nhưng bước cuối cùng kết hợp hai tích phân dường như không chỉ liên quan đến những gì bạn đã xác định là và mà còn cả v.v. Đó là lỗi. yis1s2invlogit(α+βx(n))
Jarle Tufto

1
Vâng bạn đã đúng. Các thương hiệu khác nhau ở hai nơi đó vì vậy bạn không thể kết hợp chúng.
Taylor

Thật không may, điều này giả sử là trường hợp phổ biến nhất. n>1
Taylor

2

Điều đó không đúng, tôi tin. Tôi chỉ cần chứng minh rằng Hàm biểu thị Bây giờ là một hàm tăng đơn điệu, khi , chúng ta có

αRβ>0p(yα,β,x)=+.
σ=invlogit
σβ>0
σ(α+βxi)>σ(αβmax|xi|)>0,
1σ(α+βxi)>1σ(α+βmax|xi|)>0.

Do đó, tích phân

αRβ>0p(yα,β,x)>αRβ>0[σ(αβmax|xi|)]yi[1σ(α+βmax|xi|)]niyi>αRβ>0[σ(αβmax|xi|)]maxni[1σ(α+βmax|xi|)]maxni>αRβ>0[σ(αβmax|xi|)]kmaxni[1σ(α+βmax|xi|)]kmaxni

Cần thêm các thuộc tính về : σ

(σ(x))N=1(1+ex)N>12N(max{1,ex})N=12N(max{1,eNx})>12Nσ(Nx)

Đặt, , sau đó ξ=αβmax|xi|η=α+βmax|xi|,N=kmaxni

αRβ>0p(yα,β,x)>αRβ>0[σ(αβmax|xi|)]N[1σ(α+βmax|xi|)]N<ξ<η<+[σ(ξ)]N[σ(η)]N>122Nξ+(+σ(Nξ)dξ) σ(Nη)dη=+


1
Tôi đã thực hiện một số phiên bản. Hy vọng nó đúng.
Bài hát ngớ ngẩn

1
Trong bước cuối cùng thứ hai, tôi nghĩ rằng các giới hạn của tích phân kép là sai. Thay vào đó, tôi nhận được Sử dụng Maple, tôi thấy rằng tích phân kép này là hữu hạn và bằng . Vì vậy, tất cả những gì bạn có thể nói dựa trên đạo hàm của bạn là hằng số chuẩn hóa của hậu thế của lớn hơn một cái gì đó hữu hạn.
σ(Nη)ησ(Nξ)dξdη
π/(6N2)α,β
Jarle Tufto

1

Tôi đã chấp nhận một câu trả lời, nhưng tôi muốn chỉ ra rằng hậu thế không phù hợp với tất cả các tập dữ liệu có thể. Hậu thế tỷ lệ thuận với khả năng, đó là Nếu , thì điều này đơn giản hóa thành

i=1k[invlogit(α+βxi)]yi[1invlogit(α+βxi)]nyi.
y1=y2==yk=n
i=1k[invlogit(α+βxi)]n,

và chúng ta có thể thấy rằng

i=1k[invlogit(α+βxi)]ndαdβ0i=1k[invlogit(α+βxi)]ndαdβ0[invlogit(α+βx(1))]nkdαdβ0[invlogit(r1)]nkdr1dr2=.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.