Tôi không nghĩ rằng hầu hết các câu trả lời này thực sự trả lời câu hỏi nói chung. Chúng được giới hạn trong trường hợp khi có một giả thuyết null đơn giản và khi thống kê kiểm tra có CDF không thể đảo ngược (như trong một biến ngẫu nhiên liên tục có CDF tăng nghiêm ngặt). Những trường hợp này là những trường hợp mà hầu hết mọi người có xu hướng quan tâm với kiểm tra z và kiểm tra t, mặc dù để kiểm tra trung bình nhị thức (ví dụ) người ta không có CDF như vậy. Những gì được cung cấp ở trên có vẻ đúng với mắt tôi đối với những trường hợp bị hạn chế này.
Nếu các giả thuyết null là tổng hợp thì mọi thứ phức tạp hơn một chút. Bằng chứng tổng quát nhất về thực tế này tôi đã thấy trong trường hợp tổng hợp sử dụng một số giả định liên quan đến các khu vực từ chối được cung cấp trong "Giả thuyết thống kê thử nghiệm" của Lehmann và Romano, trang 63-64. Tôi sẽ cố gắng tạo lại đối số bên dưới ...
Chúng tôi thử nghiệm một giả thuyết so với một giả thuyết thay thế dựa trên một thống kê kiểm tra, mà chúng tôi sẽ biểu thị như các biến ngẫu nhiên . Thống kê kiểm tra được giả sử đến từ một số lớp tham số, ví dụ: , trong đó là một thành phần của họ phân phối xác suất và là một không gian tham số. Các giả thuyết và giả thuyết thay thế tạo thành một phân vùng của trong đó
H0H1XX∼PθPθP≡{Pθ∣θ∈Θ}ΘH0:θ∈Θ0H1:θ∈Θ1ΘΘ=Θ0∪Θ1
trong đó
Θ0∩Θ1=∅.
Kết quả của thử nghiệm có thể được ký hiệu là
trong đó với bất kỳ tập chúng tôi xác định
Ở đây là mức ý nghĩa của chúng tôi và biểu thị vùng loại bỏ của thử nghiệm đối với mức ý nghĩa .ϕα(X)=1Rα(X)
S1S(X)={1,0,X∈S,X∉S.
αRαα
Giả sử các vùng loại bỏ thỏa mãn
if . Trong trường hợp các vùng loại bỏ lồng nhau này, rất hữu ích để xác định không chỉ giả thuyết null có bị từ chối ở mức ý nghĩa nhất định , mà còn để xác định mức ý nghĩa nhỏ nhất mà giả thuyết null sẽ bị từ chối. Cấp độ này được gọi là giá trị p ,
Số này cho chúng tôi ý tưởng về dữ liệu mạnh như thế nào (như được mô tả bởi thống kê kiểm tra ) mâu thuẫn với giả thuyết null . Rα⊂Rα′
α<α′αp^=p^(X)≡inf{α∣X∈Rα},
XH0
Giả sử rằng cho một số và rằng . Giả sử thêm rằng các vùng loại bỏ tuân theo thuộc tính lồng nhau đã nêu ở trên. Sau đó, giữ sau:X∼Pθθ∈ΘH0:θ∈Θ0Rα
Nếu cho tất cả , thì với ,
supθ∈Θ0Pθ(X∈Rα)≤α0<α<1θ∈Θ0Pθ(p^≤u)≤ufor all0≤u≤1.
Nếu với chúng ta có cho tất cả , thì với chúng ta có
θ∈Θ0Pθ(X∈Rα)=α0<α<1θ∈Θ0Pθ(p^≤u)=ufor all0≤u≤1.
Lưu ý thuộc tính đầu tiên này chỉ cho chúng ta biết rằng tỷ lệ dương tính giả được kiểm soát tại bằng cách từ chối khi giá trị p nhỏ hơn và thuộc tính thứ hai cho chúng ta (đưa ra một giả định bổ sung) rằng các giá trị p được phân phối đồng đều dưới giá trị null giả thuyết.uu
Bằng chứng là như sau:
Đặt và giả sử cho tất cả . Sau đó, theo định nghĩa của , chúng ta có cho tất cả . Theo tính đơn điệu và giả định, theo sau cho tất cả . Để cho , nó theo .θ∈Θ0supθ∈Θ0Pθ(X∈Rα)≤α0<α<1p^{p^≤u}⊂{X∈Rv}u<vPθ(p^≤u)≤Pθ(X∈Rv)≤vu<vv↘uPθ(p^≤u)≤u
Đặt và giả sử rằng cho tất cả . Sau đó và theo tính đơn điệu, nó theo sau đó . Xem xét (1), theo sau . θ∈Θ0Pθ(X∈Rα)=α0<α<1{X∈Ru}⊂{p^(X)≤u}u=Pθ(X∈Ru)≤Pθ(p^≤u)Pθ(p^(X)≤u)=u
Lưu ý rằng giả định trong (2) không giữ khi thống kê kiểm tra rời rạc ngay cả khi giả thuyết null đơn giản hơn là tổng hợp. Ví dụ: với và . Tức là, lật một đồng xu mười lần và kiểm tra xem liệu nó có công bằng so với thiên vị đối với người đứng đầu hay không (được mã hóa thành 1). Xác suất nhìn thấy 10 đầu trong 10 lần lật đồng xu công bằng là (1/2) ^ 10 = 1/1024. Xác suất nhìn thấy 9 hoặc 10 đầu trong 10 lần tung đồng xu công bằng là 11/1024. Đối với mọi hoàn toàn trong khoảng từ 1/1024 đến 11/1024, bạn sẽ từ chối null nếu , nhưng chúng tôi không có cho các giá trị đó của khi nàoX∼Binom(10,θ)H0:θ=.5H1:θ>0.5αX=10Pr(X∈Rα)=ααθ=0.5 . Thay vào đó cho như vậy . Pr(X∈Rα)=1/1024α