Là Bonferroni điều chỉnh quá chống bảo thủ / tự do cho một số giả thuyết phụ thuộc?


8

Tôi thường đọc rằng hiệu chỉnh Bonferroni cũng hoạt động cho các giả thuyết phụ thuộc. Tuy nhiên, tôi không nghĩ đó là sự thật và tôi có một ví dụ ngược lại. Ai đó có thể vui lòng cho tôi biết (a) lỗi của tôi ở đâu hoặc (b) liệu tôi có đúng về điều này không.

Thiết lập ví dụ truy cập

Giả sử chúng ta đang thử nghiệm hai giả thuyết. Đặt là giả thuyết đầu tiên là sai và nếu không. Xác định tương tự. Đặt là các giá trị p được liên kết với hai giả thuyết và để thị chức năng chỉ báo cho tập hợp được chỉ định bên trong dấu ngoặc.H1=0H1=1H2p1,p2[[]]

Đối với cố định xác định rõ ràng là mật độ xác suất trên . Đây là một âm mưu của hai mật độθ[0,1] [0,1]2

P(p1,p2|H1=0,H2=0)=12θ[[0p1θ]]+12θ[[0p2θ]]P(p1,p2|H1=0,H2=1)=P(p1,p2|H1=1,H2=0)=1(1θ)2[[θp11]][[θp21]]
[0,1]2

nhập mô tả hình ảnh ở đây

Lợi nhuận cận biên và tương tự cho . p2

P(p1|H1=0,H2=0)=12θ[[0p1θ]]+12P(p1|H1=0,H2=1)=1(1θ)[[θp11]]
p2

Hơn nữa, hãy để Điều này ngụ ý rằng P(p1|H1=0)

P(H2=0|H1=0)=P(H1=0|H2=0)=2θ1+θP(H2=1|H1=0)=P(H1=1|H2=0)=1θ1+θ.
p2
P(p1|H1=0)=h2{0,1}P(p1|H1=0,h2)P(h2|H1=0)=12θ[[0p1θ]]2θ1+θ+122θ1+θ+1(1θ)[[θp11]]1θ1+θ=11+θ[[0p1θ]]+θ1+θ+11+θ[[θp11]]=U[0,1]
là thống nhất theo yêu cầu đối với các giá trị p theo giả thuyết Null. Điều tương tự cũng đúng với vì tính đối xứng.p2

Để có được phân phối chung chúng tôi tính toánP(H1,H2)

P ( H 1 , H 2 )

P(H2=0|H1=0)P(H1=0)=P(H1=0|H2=0)P(H2=0)2θ1+θP(H1=0)=2θ1+θP(H2=0)P(H1=0)=P(H2=0):=q
Do đó, phân phối chung được đưa ra bởi có nghĩa là .
P(H1,H2)=H2=0H2=1H1=02θ1+θq1θ1+θqH1=11θ1+θq1+θ2q1+θ
0q1+θ2

Tại sao nó là một ví dụ phản tác dụng

Bây giờ, hãy để cho mức ý nghĩa quan tâm. Xác suất để có ít nhất một dương tính giả với mức ý nghĩa đã sửa cho rằng cả hai giả thuyết đều sai (tức là ) được đưa ra bởi vì tất cả các giá trị của và đều thấp hơn cho rằng vàθ=α2αα2Hi=0

P((p1α2)(p2α2)|H1=0,H2=0)=1
p1p2 H1=0H2=0αα2H1=0H2=0bằng cách xây dựng. Tuy nhiên, hiệu chỉnh Bonferroni sẽ cho rằng FWER nhỏ hơn .α

Câu hỏi rất hay. Tôi ước ai đó sẽ trả lời

1
Trái ngược với sự bảo thủ là chống đối trong thế giới thống kê!
AdamO

Không biết điều đó. Tôi nghĩ rằng tôi đọc tự do một vài lần.
fabee


Cảm ơn, nhưng đó là về một cái gì đó khác nhau. Bạn cần một giả định bổ sung (sự phụ thuộc không phải là vấn đề, xem câu trả lời của tôi dưới đây).
fabee

Câu trả lời:


3

Bonferroni không thể tự do, bất kể sự phụ thuộc, nếu giá trị p của bạn được tính toán chính xác.

Đặt A là sự kiện lỗi Loại I trong một thử nghiệm và gọi B là sự kiện lỗi Loại I trong một thử nghiệm khác. Xác suất mà A hoặc B (hoặc cả hai) sẽ xảy ra là:

P (A hoặc B) = P (A) + P (B) - P (A và B)

Vì P (A và B) là một xác suất và do đó không thể âm, nên không có cách nào để phương trình đó tạo ra giá trị cao hơn P (A) + P (B). Giá trị cao nhất mà phương trình có thể tạo ra là khi P (A và B) = 0, tức là khi A và B phụ thuộc hoàn toàn tiêu cực. Trong trường hợp đó, bạn có thể điền vào phương trình như sau, giả sử cả hai giá trị null đúng và mức alpha điều chỉnh Bonferroni là 0,25:

P (A hoặc B) = P (A) + P (B) - P (A và B) = .025 + .025 - 0 = .05

Trong bất kỳ cấu trúc phụ thuộc nào khác, P (A và B)> 0, do đó phương trình tạo ra một giá trị thậm chí nhỏ hơn 0,05. Ví dụ, dưới sự phụ thuộc tích cực hoàn hảo, P (A và B) = P (A), trong trường hợp đó bạn có thể điền vào phương trình như sau:

P (A hoặc B) = P (A) + P (B) - P (A và B) = .025 + .025 - .025 = .025

Một ví dụ khác: dưới sự độc lập, P (A và B) = P (A) P (B). Vì thế:

P (A hoặc B) = P (A) + P (B) - P (A và B) = .025 + .025 - .025 * .025 = .0494

Như bạn có thể thấy, nếu một sự kiện có xác suất 0,25 và một sự kiện khác cũng có xác suất 0,25, thì xác suất của một trong hai hoặc cả hai sự kiện này đều lớn hơn 0,05, vì P không thể xảy ra. A hoặc B) lớn hơn P (A) + P (B). Bất kỳ yêu cầu ngược lại là vô lý.

"Nhưng đó là giả sử cả hai null là đúng", bạn có thể nói. "Điều gì xảy ra nếu null đầu tiên là đúng và thứ hai là sai?" Trong trường hợp đó, B là không thể vì bạn không thể có lỗi Loại I trong đó giả thuyết null là sai. Do đó, P (B) = 0 và P (A và B) = 0. Vì vậy, hãy điền vào công thức chung của chúng tôi cho FWER của hai bài kiểm tra:

P (A hoặc B) = P (A) + P (B) - P (A và B) = .025 + 0 - 0 = .025

Vì vậy, một lần nữa FWER là <.05. Lưu ý rằng sự phụ thuộc là không liên quan ở đây vì P (A và B) luôn bằng 0. Một kịch bản có thể khác là cả hai null đều sai, nhưng rõ ràng là FWER sau đó sẽ là 0, và do đó <.05.


Cảm ơn câu trả lời. Tôi đọc các dẫn xuất như của bạn nhiều lần và chúng có ý nghĩa. Tuy nhiên, tôi vẫn không thấy lỗi trong ví dụ của mình. Nếu nó là vô nghĩa, lỗi của tôi ở đâu? Tôi có cảm giác rằng vấn đề là bạn lấy thành , nhưng đối với FWER bạn thực sự quan tâm đến . Bạn vẫn có thể có nhưng . Đây là những gì tôi xây dựng trong ví dụ của tôi. Ví dụ của bạn là đúng nếu lỗi loại I độc lập với giả thuyết khác. P(A)P(A|H01=True)P(AB|H0(1)=TrueH0(2)=True)P(A|H0(1)=True)=αP(A|H0(1)=TrueH0(2)=True)>α
fabee

Việc tính toán FWER giả sử cả hai null đều đúng, vì vậy P (A) có nghĩa giống như P (A | null 1 là đúng) và P (B) có nghĩa giống như P (B | null 2 ​​là đúng). Xác suất có điều kiện là không cần thiết. Có lẽ bạn nên viết lại ví dụ của bạn mà không có chúng. Lưu ý rằng nếu "tất cả các giá trị của p1 và p2 thấp hơn α / 2 do H1 = 0 và H2 = 0 khi xây dựng", thì bạn chỉ cần xây dựng một kịch bản trong đó các giá trị p không được tính toán chính xác. Nếu mỗi p được kiểm tra ở mức α / 2, thì mỗi p phải có cơ hội có ý nghĩa α / 2 theo định nghĩa, nhưng rõ ràng bạn đã cho mỗi p 100% cơ hội có ý nghĩa.
Bonferroni

Tôi không nghĩ bạn đúng. Nếu tỷ lệ lỗi FWER giả sử cả hai null là đúng, thì tôi muốn tính P (A hoặc B | null 1 và 2 là đúng). Do đó, sự phân tách mà bạn đã viết trong câu trả lời của mình cần có cùng điều kiện ở phía bên tay phải. Chỉ khi sử dụng xác suất có điều kiện, điều này trở nên rõ ràng. Giá trị p của tôi được tính toán chính xác vì P (A | null 1 là đúng) vẫn là . Nhưng lưu ý rằng P (A | null 1 là đúng) thường không giống với P (A | null 1 và null 2 ​​là đúng). α
fabee

1
Vẽ một hình vuông lớn trên một tờ giấy thể hiện tổng không gian mẫu của các kết quả có thể xảy ra. Sau đó vẽ một hình tròn chiếm 2,5% diện tích hình vuông và dán nhãn A. Sau đó vẽ một hình tròn khác chiếm 2,5% diện tích hình vuông và dán nhãn B. Tạo A và B chồng lên nhau ít hoặc nhiều như bạn muốn (tức là chơi với sự phụ thuộc giữa A và B). Bạn sẽ thấy không có cách nào cho diện tích kết hợp của A và B là hơn 2,5% + 2,5% = 5%.
Bonferroni

1
Có vẻ như bạn đang bối rối về xác suất ở mức độ rất cơ bản và chưa sẵn sàng để giải quyết toán học. Chúng tôi giả sử cả hai null đều đúng vì đó là tình huống tạo ra FWER tối đa. Nếu cả hai null đều sai, rõ ràng không thể có bất kỳ lỗi Loại I nào cả. Và nếu một null là đúng và một null là sai, tỷ lệ lỗi chỉ đơn giản là bất kỳ mức độ alpha nào bạn sử dụng để kiểm tra mức đúng.
Bonferroni

0

Tôi nghĩ rằng cuối cùng tôi đã có câu trả lời. Tôi cần một yêu cầu bổ sung về phân phối . Trước đây, tôi chỉ yêu cầu đồng nhất trong khoảng từ 0 đến 1. Trong trường hợp này, ví dụ của tôi là chính xác và Bonferroni sẽ quá tự do. Tuy nhiên, nếu tôi yêu cầu thêm tính đồng nhất của thì có thể dễ dàng nhận ra rằng Bonferroni không bao giờ có thể quá bảo thủ. Ví dụ của tôi vi phạm giả định này. Nói một cách tổng quát hơn, giả định là việc phân phối tất cả các giá trị p cho rằng tất cả các giả thuyết null đều đúng phải có dạng copula : Chung chúng không cần phải đồng nhất, nhưng ngoài lề chúng làm.P ( p 1 | H 1 = 0 ) P ( p 1 | H 1 = 0 , H 2 = 0 )P(p1,p2|H1=0,H2=0)P(p1|H1=0)P(p1|H1=0,H2=0)

Nhận xét: Nếu bất cứ ai có thể chỉ cho tôi một nguồn mà giả định này được nêu rõ (sách giáo khoa, giấy), tôi sẽ chấp nhận câu trả lời này.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.