Là tỷ lệ lỗi loại I bằng alpha hoặc nhiều nhất là alpha?


8

Theo trang Wikipedia giá trị p :

Khi giá trị p được tính toán chính xác, thử nghiệm này đảm bảo tỷ lệ lỗi Loại I nhiều nhất là .α

Tuy nhiên, tiếp tục xuống trang công thức này được đưa ra:

Pr(RejectH|H)=Pr(pα|H)=α

Giả sử 'tỷ lệ lỗi loại 1' = Pr(RejectH|H) điều này cho thấy tỷ lệ lỗi loại 1 là α chứ không phải 'nhiều nhất là α '. Nếu không, công thức sẽ đọc:

Pr(RejectH|H)α

Sự hiểu lầm của tôi ở đâu?

Câu trả lời:


8

Khi "giả thuyết khống" bao gồm nhiều hơn một trạng thái tự nhiên, tỷ lệ dương tính giả thực tế (FPR) có thể thay đổi theo trạng thái đó. Tất cả những gì chúng ta có thể làm là đảm bảo giới hạn đối với FPR cho dù trạng thái tự nhiên đó có thể là gì - nhưng chúng ta không thể luôn đảm bảo FPR thực sự bằng .α

(Có nhiều lý do khác khiến FPR có thể không thực sự bằng giá trị mục tiêu của nó , chẳng hạn như khi thống kê kiểm tra rời rạc. Những tình huống này thường có thể được chữa khỏi bằng cách sử dụng các quy trình quyết định ngẫu nhiên. Vì vậy, chúng không cung cấp bất kỳ hiểu biết cơ bản nào về câu hỏi.)α


Hãy xem xét thử nghiệm một đầu cổ điển trong đó thống kê được giả sử là có phân phối chuẩn của trung bình chưa biết và (để đơn giản) độ lệch chuẩn đã biết . được so sánh với . Giả thuyết là trong khi giả thuyết thay thế là . Do đó, vùng từ chối có dạngμ σ μ 0 H 0 : μ 0 H Một : μ < 0Xμσμ0H0:μ0HA:μ<0

R(α)=(,Zα]

trong đó được chọn sao cho cơ hội quan sát một thống kê trong khu vực này nhiều nhất là : alphaZα α

(1)α=sup(Pr(XR(α))).

Theo các giả định, xác suất này được đưa ra bởi hàm phân phối chuẩn :Φ

(2)Pr(XR(α))=Φ(Zαμσ).

Xác suất này phụ thuộc vào giá trị chưa biết của . μ Do đó, chúng tôi không thể đảm bảo rằng nó thực sự bằng . Thật vậy, đối với lớn , thực tế bằng không. Tuy nhiên, chúng tôi phải bao gồm tất cả các cơ sở của mình và đảm bảo rằng miễn là phù hợp với giả thuyết khống, tỷ lệ dương tính giả sẽ không vượt quá . μ ( 2 ) μ ( 1 ) ααμ(2)μ(1)α


1
@ JackPierce-Brown Công thức này đúng với giả thuyết điểm null và cho thống kê kiểm tra liên tục. Đó là những gì phải được giả định trong bài viết Wikipedia, nhưng có lẽ không được đánh vần. (+1)
amip

1
@Amoeba nói đúng. Ngoài ra, lưu ý rằng chỉ có một vài thử nghiệm thực tế thực sự liên quan đến các giả thuyết điểm Null. Ngay cả bài kiểm tra Sinh viên cổ điển của so với không phải là điểm Null, bởi vì có các khả năng đa dạng cho giá trị không xác định của tham số mặc dù null không giảm giá trị của . H Một : μ > 0 σ μH0:μ=0 HA:μ>0σμ
whuber

1
@whuber Hmm, ví dụ kiểm tra t của bạn là khó hiểu. Bạn có thể xây dựng? Tôi nghĩ là điểm null, vì là điểm và không nhập giả thuyết null. Nếu nó không phải là điểm null, điều đó có nghĩa là tỷ lệ lỗi loại I không bằng ? Tôi đã nghĩ nó nên bằng dù là gì. 0 σ alpha alpha σH0=00σαασ
amip

2
@Amoeba rất nhiều là một phần của giả thuyết null. Một cách nghiêm ngặt, không gian tham số làGiả thuyết là tập hợp conĐó không phải là một trạng thái tự nhiên. Nhưng có lẽ đây không phải là ví dụ tốt nhất có thể, bởi vì việc phân phối thống kê không phụ thuộc vào : đó là lý do tại sao một FPR không đổi là có thể. Θ = { ( μ , σ ) μ R ,σH 0 = { ( μ , σ ) | μ = 0 , σ 0 } q . t σ
Θ={(μ,σ)μR,σ0}.
H0={(μ,σ)μ=0,σ0}Θ.
tσ
whuber

1
Hấp dẫn. Tôi hiểu rồi.
amip

4

Đó là một vấn đề lén lút. Nếu bạn có dữ liệu liên tục và bạn xử lý chúng một cách thích hợp, thì . Tuy nhiên, khi dữ liệu của bạn rời rạc, có thể không khả dụng . Xem xét dữ liệu nhị thức về việc một đồng xu có công bằng hay không, với 5 lần lật đồng xu, các giá trị p một phía có thể là: p = αPr(pα|H0)=αp=α

> pbinom(0:5, size=5, prob=.5)
[1] 0.03125 0.18750 0.50000 0.81250 0.96875 1.00000

Chỉ có đầu có thể mang lại lỗi loại I và xác suất liên quan đến đó là . Vì vậy, tỷ lệ lỗi loại I sẽ được giữ ở mức "tối đa là ", nhưng không bằng . 0.0300.03 alphaα α

Mặt khác, có các chiến lược phân tích (không hợp lệ) dẫn đến tỷ lệ lỗi loại I lớn hơn , ngay cả khi (ví dụ: thói quen lựa chọn từng bước). p < ααp<α

Tôi có một cuộc thảo luận đầy đủ hơn ở đây: So sánh và đối chiếu, giá trị p, mức ý nghĩa và lỗi loại I

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.