Làm cách nào để xác định Vùng từ chối khi không có UMP?


13

Hãy xem xét mô hình hồi quy tuyến tính

y=Xβ+u ,

uN(0,σ2I) ,

E(uX)=0 .

Hãy H0:σ02=σ2 vs H1:σ02σ2 .

Chúng ta có thể suy ra rằng yTMXyσ2χ2(nk), nơidim(X)=n×k. VàMXlà ký hiệu đặc trưng cho ma trận Annihilator,MXy=y^ , nơi y là biến phụ thuộcythụt lùi trênX.y^yX

Cuốn sách tôi đang đọc nói như sau: nhập mô tả hình ảnh ở đây

Trước đây tôi đã hỏi những tiêu chí nào nên được sử dụng để xác định Vùng từ chối (RR), xem câu trả lời cho câu hỏi này và tiêu chí chính là chọn RR làm cho bài kiểm tra mạnh nhất có thể.

Trong trường hợp này, với giải pháp thay thế là giả thuyết tổng hợp song phương thường không có xét nghiệm UMP. Ngoài ra, bằng câu trả lời được đưa ra trong cuốn sách, các tác giả không cho thấy nếu họ đã nghiên cứu về sức mạnh của RR của họ. Tuy nhiên, họ đã chọn một RR hai đuôi. Tại sao điều đó, vì giả thuyết không 'đơn phương' xác định RR?

Chỉnh sửa: Hình ảnh này nằm trong hướng dẫn giải pháp của cuốn sách này như là giải pháp để thực hiện 4.14.


Vui lòng thêm một tài liệu tham khảo cho cuốn sách. Liên quan: Giá trị P trong thử nghiệm hai đuôi với phân phối null không đối xứng .
Scortchi - Phục hồi Monica

@Scortchi cảm ơn vì đường link. Tôi có thể hỏi bạn vài điều về câu hỏi này? Bạn có thấy nó thú vị không? Tôi đang cố gắng đánh giá liệu tôi đang đưa ra những câu hỏi thú vị hay liệu tôi nên hướng sở thích của mình sang các lĩnh vực khác ...
Một ông già ở biển.

Tất nhiên không phải ai cũng thấy lý thuyết thú vị, nhưng một số người làm (bao gồm cả tôi) và chúng tôi đã có gần 2k qs được gắn thẻmathematical-statistics . Vì vậy, một q tốt. IMO. Nó hơi rộng nhưng tôi nghĩ rằng một câu trả lời tốt sẽ khảo sát các cách tiếp cận và cân nhắc khác nhau, và một ví dụ động lực giúp ích rất nhiều. (Tôi đã chọn một ví dụ đơn giản nhất có thể - thử nghiệm về phương sai của phân phối bình thường với giá trị trung bình đã biết hoặc giá trị trung bình của phân phối theo cấp số nhân.) .]
Scortchi - Phục hồi Monica

@Scortchi cảm ơn phản hồi của bạn. Đôi khi tôi không chắc mình có cấu trúc tốt câu hỏi không, vì tôi đang tự nghiên cứu vấn đề này.
Một ông già ở biển.

2
Bạn nên xác định MX
Taylor

Câu trả lời:


7

Dễ dàng hơn để làm việc đầu tiên thông qua trường hợp các hệ số hồi quy đã biết & giả thuyết null do đó đơn giản. Khi đó thống kê đủ là , trong đó z là số dư; phân phối của mình theo null cũng là một chi-squared thu nhỏ lại bởi σ 2 0T=z2zσ02 & với bậc tự do tương đương với kích thước mẫu .n

Viết ra tỷ số giữa các khả năng dưới & σ = σ 2 & xác nhận rằng đó là một chức năng ngày càng cao của T đối với bất kỳ σσ=σ1σ=σ2T :σ2>σ1

Chức năng tỷ lệ log likelihood là , và tỷ lệ thuận vớiTvới độ dốc dương tính khiσ

(σ2;T,n)(σ1;T,n)=n2[log(σ12σ22)+Tn(1σ121σ22)]
T .σ2>σ1

Vì vậy, bằng các Karlin-Rubin lý mỗi bài kiểm tra một đuôi vs H Một : σ < σ 0 & H 0 : σ = σ 0 vs H Một : σ < σ 0 là thống nhất mạnh mẽ nhất. Rõ ràng không có thử nghiệm UMP của H 0 : σ = σ 0 vs H MộtH0:σ=σ0HA:σ<σ0H0:σ=σ0HA:σ<σ0H0:σ=σ0 . Như đã thảo luậnở đâyHA:σσ0, Thực hiện cả hai bài thi một đuôi & áp dụng nhiều so sánh dẫn sửa chữa để kiểm tra thường được sử dụng với các vùng từ chối kích thước bằng nhau ở cả đuôi, và nó khá hợp lý khi bạn đang đi để khẳng định hoặc là hoặc σ < σ 0 khi bạn từ chối null.σ>σ0σ<σ0

Tiếp theo tìm tỷ số giữa các khả năng dưới , ước tính tối đa-khả năng σ , & σ = σ 0 :σ=σ^σσ=σ0

Như σ 2 = T , các log likelihood thống kê kiểm tra tỷ lệ là( σ ;T,n)-(σ0;T,σ^2=Tn

(σ^;T,n)(σ0;T,n)=n2[log(nσ02T)+Tnσ021]

Đây là một con số tốt cho định lượng bao nhiêu sự ủng hộ dữ liệu trên H 0 : σ = σ 0 . Và khoảng tin cậy được hình thành từ việc đảo ngược thử nghiệm tỷ lệ khả năng có đặc tính hấp dẫn rằng tất cả các giá trị tham số bên trong khoảng có khả năng cao hơn so với bên ngoài. Phân phối tiệm cận của hai lần tỷ lệ khả năng đăng nhập đã được biết đến, nhưng đối với một thử nghiệm chính xác, bạn không cần cố gắng thực hiện phân phối của nó, chỉ cần sử dụng xác suất đuôi của các giá trị T tương ứng ở mỗi đuôi.HA:σσ0H0:σ=σ0T

Nếu bạn không thể có một bài kiểm tra mạnh mẽ nhất, bạn có thể muốn một bài kiểm tra mạnh nhất so với các lựa chọn gần nhất với null. Tìm đạo hàm của hàm khả năng ghi nhật ký đối với Hàm số điểm:σ

d(σ;T,n)dσ=Tσ3nσ

σ0H0:σ=σ0HA:σσ0

αϕ(T)=1T<c1T>c2, else ϕ(T)=0, you can find the uniformly most powerful unbiased test by solving

E(ϕ(T))=αE(Tφ(T))= =αET

Một âm mưu giúp thể hiện sự thiên vị trong bài kiểm tra các khu vực đuôi bằng nhau và cách nó phát sinh:

Plot of power of the test against alternatives

Tại các giá trị của σ hơn một chút σ0 xác suất tăng của số liệu thống kê kiểm tra 'rơi vào từ chối từ chối đuôi trên không bù cho xác suất giảm của nó rơi ở vùng loại bỏ đuôi thấp & sức mạnh của phép thử giảm xuống dưới kích thước của nó.

Không thiên vị là tốt; nhưng không phải là hiển nhiên rằng có một công suất thấp hơn một chút so với kích thước trong một vùng nhỏ của không gian tham số trong phương án thay thế là rất tệ khi loại trừ hoàn toàn thử nghiệm.

Hai trong số các thử nghiệm hai đuôi ở trên trùng khớp (đối với trường hợp này, không nói chung):

LRT là UMP trong số các thử nghiệm không thiên vị. Trong trường hợp điều này không đúng, LRT vẫn có thể không thiên vị.

Tôi nghĩ rằng tất cả, ngay cả các thử nghiệm một đầu, đều được chấp nhận, nghĩa là không có thử nghiệm nào mạnh hơn hoặc mạnh hơn trong tất cả các lựa chọn thay thế. Bạn có thể làm cho thử nghiệm mạnh hơn đối với các lựa chọn thay thế theo một hướng chỉ bằng cách làm cho nó kém mạnh hơn so với các lựa chọn khác phương hướng. Khi kích thước mẫu tăng lên, phân phối chi bình phương trở nên ngày càng cân xứng hơn, và tất cả các thử nghiệm hai đuôi sẽ kết thúc giống nhau (một lý do khác để sử dụng thử nghiệm có đuôi dễ dàng).

Với giả thuyết null tổng hợp, các đối số trở nên phức tạp hơn một chút, nhưng tôi nghĩ bạn có thể nhận được kết quả thực tế tương tự, với những thay đổi thích hợp. Lưu ý rằng một nhưng không phải là một trong các thử nghiệm một đuôi là UMP!


Scortchi cảm ơn câu trả lời của bạn. Tôi vẫn còn một số nghi ngờ, mặc dù. Đầu tiên, bạn có thể giải thích thêm một chút về câu sau không? «Áp dụng hiệu chỉnh nhiều so sánh dẫn đến thử nghiệm thường được sử dụng với các vùng loại bỏ có kích thước bằng nhau ở cả hai đuôi, và nó khá hợp lý khi bạn sẽ tuyên bố rằng> σ0 hoặc <0 khi bạn từ chối null.» Ngoài ra tại sao bạn nói nó hợp lý? Tôi nghĩ rằng đây là cốt lõi của câu hỏi của tôi nếu tôi không nhầm. ;)
Một ông già ở biển.

Tôi đã đọc đoạn này từ câu trả lời được liên kết của bạn, nhưng tôi không hiểu rõ về nó «Nhân đôi giá trị p một đầu thấp nhất có thể được xem là một phép hiệu chỉnh nhiều so sánh để thực hiện hai bài kiểm tra một đầu.» Tôi sẽ rất biết ơn nếu bạn có thể vui lòng giải thích thêm một chút. ;)
Một ông già ở biển.

Xem Bonferroni điều chỉnh . Nếu bạn thực hiện hai kích thước riêng biệtα/2 kiểm tra lỗi Loại I khôn ngoan của gia đình không nhiều hơn α, & khi các vùng từ chối tách rời chính xác α. I wanted to point out that the equal-tail-areas test can be seen in this way because people sometimes seem to think the only reasons to use it are ease of calculation & approximation to the other tests. In fact each test has its own rationale: so I wouldn't say this was the core of your question; it's a matter of horses for courses.
Scortchi - Reinstate Monica

1

In this case, with the alternative being a bilateral composite hypothesis there's usually no UMP test.

Tôi không chắc chắn nếu đó là sự thật nói chung. Chắc chắn, rất nhiều kết quả cổ điển (Neymon-Pearson, Karlin-Rubin) dựa trên giả thuyết đơn giản hoặc một phía, nhưng tồn tại khái quát cho giả thuyết tổng hợp hai mặt. Bạn có thể tìm thấy một số ghi chú về điều đó ở đây , và thảo luận thêm trong sách giáo khoa ở đây .

Đối với vấn đề của bạn cụ thể, tôi không biết liệu thử nghiệm UMP có tồn tại hay không. Nhưng theo trực giác, dường như là thua 0-1, một bài kiểm tra một phía có thể sẽ không được chấp nhận, và do đó, lớp kiểm tra được chấp nhận sẽ là tất cả các bài kiểm tra hai mặt. Cung cấp cho lớp các bài kiểm tra hai mặt, mục tiêu là tìm ra bài kiểm tra có sức mạnh lớn nhất, điều này sẽ tự động xảy ra bằng cách chọn các lượng tử xung quanh một chế độ củaχ2. (Đây là tất cả dựa trên trực giác).


3
There's clearly not a uniformly most powerful test in this case because of the existence of different tests most powerful against particular alternatives in different directions from σ0. For a "best" test defined in terms of power you'd have to look for the uniformly most powerful test of all unbiased tests, or of all invariant tests; or for a locally most powerful test; or something like that - & perhaps end up settling for any admissible test.
Scortchi - Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.