Các thuộc tính thống kê '' mong muốn 'của thử nghiệm tỷ lệ khả năng là gì?


11

Tôi đang đọc một bài báo có phương pháp hoàn toàn dựa trên thử nghiệm tỷ lệ khả năng. Tác giả nói rằng thử nghiệm LR đối với các lựa chọn thay thế một phía là UMP. Ông tiến hành bằng cách tuyên bố rằng

"... ngay cả khi [thử nghiệm LR] không thể được chứng minh là mạnh nhất, thử nghiệm LR thường có các thuộc tính thống kê mong muốn."

Tôi tự hỏi những gì thuộc tính thống kê có nghĩa là ở đây. Cho rằng tác giả đề cập đến những người đi qua, tôi cho rằng họ là kiến ​​thức phổ biến trong số các nhà thống kê.

Thuộc tính mong muốn duy nhất mà tôi đã quản lý để tìm thấy cho đến nay là phân phối chi bình phương tiệm cận của (trong một số điều kiện đều đặn), trong đó là tỷ lệ LR.bước sóng2logλλ

Tôi cũng rất biết ơn vì đã tham khảo một văn bản cổ điển nơi người ta có thể đọc về những đặc tính mong muốn đó.


Bạn có thể xem (chap 15 & 16) của van Der Waart: "Thống kê tiệm cận".
kjetil b halvorsen

Câu trả lời:


5

Có thể là tốt để đọc Điều gì sau đây nếu chúng ta không từ chối giả thuyết null? trước lời giải thích dưới đây.

Thuộc tính mong muốn: sức mạnh

Trong thử nghiệm giả thuyết, mục tiêu là tìm ra 'bằng chứng thống kê' cho . Do đó, chúng tôi có thể mắc lỗi loại I, tức là chúng tôi từ chối (và quyết định rằng có bằng chứng ủng hộ ) trong khi là đúng (tức là là sai). Vì vậy, lỗi loại I là 'tìm bằng chứng sai' cho .H 0 H 1 H 0 H 1 H 1H1H0H1H0H1H1

Một lỗi loại II được tạo ra khi không thể bị từ chối trong khi đó là sai trong thực tế, tức là chúng tôi '' chấp nhận '' và chúng tôi 'bỏ lỡ' bằng chứng cho .H 0 H 1H0H0H1

Xác suất của lỗi loại I được biểu thị bằng , mức ý nghĩa được chọn. Xác suất của lỗi loại II được ký hiệu là và được gọi là sức mạnh của thử nghiệm, đó là xác suất tìm thấy bằng chứng có lợi cho khi là đúng.β 1 - β H 1 H 1αβ1βH1H1

Trong thử nghiệm giả thuyết thống kê, nhà khoa học sửa ngưỡng trên cho xác suất xảy ra lỗi loại I và dưới sự ràng buộc đó cố gắng tìm một thử nghiệm có công suất tối đa, được đưa ra .α

Các tính chất mong muốn của các thử nghiệm tỷ lệ khả năng phải làm với sức mạnh

Trong thử nghiệm giả thuyết so với giả thuyết null và giả thuyết thay thế được gọi là '' đơn giản '', tức là tham số được cố định theo một giá trị, cũng như dưới như dưới (chính xác hơn; các bản phân phối được xác định đầy đủ). H 1 : θ = θ 1 H 0 H 1H0:θ=θ0H1:θ=θ1H0H1

Các Neyman-Pearson Bổ đề khẳng định rằng, đối với các bài kiểm tra giả thuyết với hypothesises đơn giản, và cho được lỗi khả năng loại I, một bài kiểm tra tỷ lệ khả năng có quyền lực cao nhất. Rõ ràng, công suất cao được cung cấp là một đặc tính mong muốn: sức mạnh là thước đo 'việc tìm kiếm bằng chứng cho dễ dàng như thế nào '.H 1αH1

Khi giả thuyết là hợp chất; ví dụ: so với thì không thể áp dụng bổ đề Neyman-Pearson vì có 'nhiều giá trị trong '. Nếu người ta có thể tìm thấy một thử nghiệm sao cho mạnh mẽ nhất cho mọi giá trị 'theo ' thì thử nghiệm đó được gọi là 'mạnh mẽ nhất' (UMP) (nghĩa là mạnh mẽ nhất cho mọi giá trị trong ).H 1 : θ > θ 1 H 1 H 1 H 1H0:θ=θ1H1:θ>θ1H1H1H1

Có một định lý của Karlin và Rubin đưa ra các điều kiện cần thiết để kiểm tra tỷ lệ khả năng là hoàn toàn mạnh mẽ nhất. Những điều kiện này được điền đầy đủ cho nhiều thử nghiệm một phía (đơn biến).

Vì vậy, tính chất mong muốn của kiểm tra tỷ lệ khả năng nằm ở thực tế là trong một số trường hợp, nó có sức mạnh cao nhất (mặc dù không phải trong tất cả các trường hợp).

Trong hầu hết các trường hợp, không thể hiển thị sự tồn tại của thử nghiệm UMP và trong nhiều trường hợp (đặc biệt là đa biến), có thể chứng minh rằng thử nghiệm UMP không tồn tại. Tuy nhiên, trong một số trường hợp, các thử nghiệm tỷ lệ khả năng được áp dụng do các đặc tính mong muốn của chúng (trong bối cảnh trên), vì chúng tương đối dễ áp ​​dụng, và đôi khi vì không thể xác định các thử nghiệm khác.

Ví dụ, thử nghiệm một phía dựa trên phân phối chuẩn thông thường là UMP.

Trực giác đằng sau bài kiểm tra tỷ lệ khả năng:

Nếu tôi muốn kiểm tra so với thì chúng tôi cần một quan sát xuất phát từ một mẫu. Lưu ý rằng đây là một giá trị duy nhất. H 1 : θ = θ 1 oH0:θ=θ0H1:θ=θ1o

Chúng tôi biết rằng là đúng hoặc là đúng, vì vậy người ta có thể tính xác suất của khi là đúng (hãy gọi nó là ) và xác suất quan sát khi là đúng (gọi là ).H 1 o H 0 L 0 o H 1 L 1H0H1oH0L0oH1L1

Nếu thì chúng tôi có xu hướng tin rằng '' có lẽ là đúng ''. Vì vậy, nếu khẩu phần chúng ta có lý do để tin rằng thực tế hơn . H 1 L 1L1>L0H1H1H0L1L0>1H1H0

Nếu sẽ giống như thì chúng tôi có thể kết luận rằng đó có thể là do tình cờ, vì vậy, để quyết định chúng tôi cần thử nghiệm và do đó, việc phân phối là .. tỷ lệ của hai khả năng. 1.001L1L1L01.001L1L0

Tôi tìm thấy pdf này trên internet.


1
Tôi nghĩ rằng điều này bỏ lỡ câu hỏi của OP: trích dẫn nói rằng ngay cả khi không thể hiển thị rằng LRT là UMP, nó vẫn có các tính năng hấp dẫn khác. Vậy các tính năng hấp dẫn không phải là UMP là gì?
Vách đá AB

@Cliff AB: Tôi nghĩ rằng có ở cuối phần đầu tiên và phần thứ hai nói trực giác tại sao nó có ý nghĩa khi sử dụng LRT. Lưu ý rằng trong hầu hết các trường hợp không có UMP và nếu không có 'thử nghiệm tốt nhất' hoặc không có giải pháp thay thế thì việc lấy thứ gì đó 'hợp lý' tôi nghĩ là không hợp lý? Nhưng nếu bạn có các yếu tố bổ sung thì bạn được mời đăng những điều này trong câu trả lời của riêng bạn. Đó là ý tưởng đằng sau SE tôi nghĩ.

Có lẽ chỉ cần tôi đọc trích dẫn ban đầu hơi khác: tôi đọc nó là "LRT có các tính năng hấp dẫn khác, bên cạnh sức mạnh".
Vách đá AB

1
@CliffAB Tôi đồng ý với nhận xét của bạn, rõ ràng tác giả của bài viết mà tôi đã đề cập trong câu hỏi của tôi có nghĩa là LRT vì lý do nào đó tốt ngay cả khi đó không phải là thử nghiệm UMP và tôi hy vọng rằng lý do này không chỉ là dễ thực hiện hay Việc thiếu các lựa chọn thay thế khác. Tôi nghi ngờ (hy vọng) rằng LRT có một số tính chất tiệm cận tốt (ví dụ: nó phù hợp, nghĩa là sức mạnh của nó đối với bất kỳ nào là nếu chúng ta tăng số lượng quan sát). 1H11
Serge Zykov

không theo ước tính dễ thực hiện!
Vách đá AB
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.