Lý thuyết đằng sau việc kiểm tra xem


7

Giả sử rằng , trong đó được biết đến. Sử dụng dữ liệu này, chúng tôi muốn kiểm tra xem , nghĩa là, liệu trung bình có phải là số hữu tỷ hay không.Xii.i.d.N(μ,σ2)σ2μQμ

Có vẻ như trực giác rõ ràng rằng chúng ta không thể làm điều này, vì bất kỳ tiếng ồn sẽ là quá nhiều tiếng ồn. Tôi tưởng tượng rằng bất kỳ thử nghiệm nào cũng sẽ có tỷ lệ lỗi loại II và tỷ lệ lỗi loại I hoặc ngược lại. Nhưng, tôi không hiểu làm thế nào để đưa ra những tuyên bố lý thuyết về vấn đề kiểm tra giả thuyết này. Làm thế nào để vấn đề này phù hợp với một khuôn khổ chung hơn minh họa khi kiểm tra là "khó khăn"?β=0α=1

Câu trả lời:


7

Trực giác của bạn là chính xác: Khi bạn có một bộ null cho giá trị trung bình dày đặc so với tổng không gian, bạn sẽ không thể phân biệt các bộ null và bộ thay thế với dữ liệu liên tục. Điều này là do, đối với bất kỳ giá trị trung bình nào trong giả thuyết thay thế, chúng ta luôn có thể nhận được một giá trị "đóng tùy ý" trong tập hợp null. Do đó, không bao giờ nên có bất kỳ bằng chứng nào cho giả thuyết thay thế.

Để có được một minh chứng chính thức về kết quả này, bạn cần trải qua các chuyển động xây dựng nó như một bài kiểm tra giả thuyết tổng hợp. Đây là một chút khó khăn, vì bạn phải đưa ra một lập luận cho một số thống kê kiểm tra, và có một số phản đối chính đáng ở đây.


Xây dựng chính thức của kiểm tra giả thuyết cổ điển: Đối với thử nghiệm này, các giả thuyết là:

H0:μQ,HA:μQ.

Vấn đề đầu tiên bạn gặp phải là xây dựng một thống kê kiểm tra. Các tỷ lệ khả năng (LR) Thống kê cho vấn đề này luôn luôn là tương đương với một, kể từ khi rationals là dày đặc trong các số thực. Chúng ta có:

supμQsupσ>0i=1nN(xi|μ,σ2)=(n2πxi2)n/2exp(n2)=supμQsupσ>0i=1nN(xi|μ,σ2),

do đó tỷ lệ của các supremums này là sự thống nhất. Điều này có nghĩa là thống kê LR tiêu chuẩn không đóng vai trò là thước đo bằng chứng cho các giả thuyết, và vì vậy chúng tôi cần một thống kê kiểm tra tùy chỉnh.

Bây giờ, đối với các giả thuyết này, xếp hạng chứng cứ thứ tự chỉ rơi vào hai loại: nếu giá trị trung bình mẫu là hợp lý (xảy ra với xác suất bằng 0), đây là bằng chứng lớn hơn cho giả thuyết khống; nếu giá trị trung bình mẫu là không hợp lý (xảy ra với xác suất một), đây là bằng chứng lớn hơn cho giả thuyết thay thế. Do đó, thống kê kiểm tra thích hợp cho thử nghiệm là , với giá trị cao hơn này (chỉ số) thống kê kiểm tra cấu thành bằng chứng lớn hơn cho sự thay thế.TT(X1,...,Xn)I(X¯Q)

Vì liên tục, nên chúng tôi có trên tất cả các giá trị tham số (điều này xuất phát từ thực tế là các tỷ lệ có số đo Lebesgue bằng 0 ). Điều này có nghĩa là thống kê kiểm tra có cùng phân phối bất kể các giá trị tham số.X¯N(μ,σ2/n)P(T=0|μ,σ)=P(X¯Q|μ,σ)=0

Nếu chúng ta quan sát (nghĩa là giá trị trung bình mẫu là không hợp lý) thì giá trị p cho thử nghiệm là:x¯Q

pP(T(X¯)t(x¯)|H0)=P(T1|μQ)=1.

Nếu chúng ta quan sát (nghĩa là giá trị trung bình mẫu là hợp lý) thì giá trị p cho thử nghiệm là:x¯Q

pP(T(X¯)t(x¯)|H0)=P(T0|μQ)=1.

Vì vậy, chúng tôi thấy rằng ngay cả với một thống kê kiểm tra tùy chỉnh cố gắng phân biệt các giả thuyết, chúng tôi không bao giờ có được bất kỳ bằng chứng nào chống lại null. Điều này là hợp lý theo trực giác, vì đối với bất kỳ giá trị trung bình nào trong giả thuyết thay thế, chúng ta luôn có thể nhận được một giá trị "đóng tùy ý" trong tập hợp null.


2
Tất nhiên mọi thứ ở đây đều đúng (+1) - nhưng tôi muốn đề xuất sự tập trung vào cấu trúc liên kết của các lý do và thực tế, và thước đo Lebesgue của chúng, phần nào bỏ lỡ một điểm cơ bản hơn (mà bạn thực hiện nhưng có lẽ không nhấn mạnh nhiều như bạn có thể). Nếu, ví dụ , mô hình là những bộ phân phối chuẩn với các thông số nơi cho và nếu không, bạn có thể kiểm traÝ nghĩa cơ bản hơn của "dày đặc" là trong cấu trúc liên kết trên mô hình được xác định bởi tỷ lệ khả năng đăng nhập. (μ,σ2(μ))σ(μ)=1μQσ(μ)=2H0:μQ.
whuber

2
Điểm hay - cuộc thảo luận của riêng tôi chỉ giới hạn trong trường hợp cụ thể có vấn đề, nhưng chắc chắn sẽ rất thú vị khi mở rộng điều này thành một cuộc thảo luận rộng hơn cho những trường hợp rộng hơn.
Ben - Tái lập Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.