Giá trị P trong thử nghiệm hai đuôi với phân phối null không đối xứng


18

Hoàn cảnh của tôi như sau: Tôi muốn, thông qua một nghiên cứu Monte-Carlo, để so sánh -values của hai bài kiểm tra khác nhau cho ý nghĩa thống kê của một tham số ước tính (null là "không có tác dụng - tham số là không", và ngụ ý khác là " tham số không bằng 0 "). Thử nghiệm A"thử nghiệm t hai mẫu độc lập tiêu chuẩn cho sự bình đẳng của phương tiện" , với phương sai bằng nhau dưới giá trị null. p

Kiểm tra B Tôi đã tự xây dựng. Ở đây, phân phối null được sử dụng là phân phối rời rạc chung không đối xứng . Nhưng tôi đã tìm thấy nhận xét sau đây trong Rohatgi & Saleh (2001, tái bản lần 2, trang 462)

"Nếu phân phối không đối xứng, giá trị không được xác định rõ trong trường hợp hai mặt, mặc dù nhiều tác giả khuyên nên nhân đôi giá trị một phía "ppp .

Các tác giả không thảo luận thêm về điều này, họ cũng không bình luận về "nhiều gợi ý của tác giả" để nhân đôi giá trị một phía . (Điều này tạo ra câu hỏi "tăng gấp đôi -giá trị của phụ không? Và tại sao bên này và không phải là khác?)ppp

Tôi không thể tìm thấy bất kỳ bình luận, ý kiến ​​hay kết quả nào khác về toàn bộ vấn đề này. Tôi hiểu rằng với phân phối bất đối xứng mặc dù chúng ta có thể xem xét một đối xứng khoảng xung quanh giả thuyết null liên quan đến giá trị của tham số, chúng ta sẽ không có đối xứng thông thường thứ hai, đó là phân bổ khối lượng xác suất. Nhưng tôi không hiểu tại sao điều này làm cho giá trị "không được xác định rõ". Cá nhân, bằng cách sử dụng một đối xứng khoảng xung quanh giả thuyết null cho các giá trị của công cụ ước tính, tôi thấy không có định nghĩapvấn đề khi nói "xác suất phân phối null sẽ tạo ra các giá trị bằng với ranh giới của, hoặc ngoài khoảng này là XX". Thực tế là khối lượng xác suất ở một phía sẽ khác với khối lượng xác suất ở phía bên kia, dường như không gây rắc rối, ít nhất là cho mục đích của tôi. Nhưng có nhiều khả năng hơn là Rohatgi & Saleh không biết điều gì mà tôi không biết.

Vì vậy, đây là câu hỏi của tôi: Theo nghĩa nào thì giá trị là (hoặc có thể) "không được xác định rõ" trong trường hợp thử nghiệm hai mặt khi phân phối null không đối xứng?p

Một lưu ý có lẽ quan trọng: Tôi tiếp cận vấn đề nhiều hơn theo tinh thần Ngư dân, tôi không cố gắng để có được một quy tắc quyết định nghiêm ngặt theo nghĩa Neyman-Pearson. Tôi để người dùng thử nghiệm sử dụng thông tin giá trị cùng với bất kỳ thông tin nào khác để đưa ra kết luận.p


4
Ngoài các phương pháp dựa trên khả năng ("Ngư dân") và dựa trên LR (NP), một phương pháp khác xem xét làm thế nào để có được khoảng tin cậy ngắn và sử dụng các phương pháp để kiểm tra giả thuyết. Điều này được thực hiện theo tinh thần của lý thuyết quyết định (và sử dụng các phương pháp của nó), trong đó độ dài được bao gồm trong hàm mất. Đối với các phân phối đối xứng không đồng đều của thống kê kiểm tra, rõ ràng các khoảng thời gian ngắn nhất có thể thu được bằng cách sử dụng các khoảng đối xứng (về cơ bản là "nhân đôi giá trị p" của các xét nghiệm một phía). Khoảng thời gian ngắn nhất phụ thuộc vào tham số hóa: do đó chúng không thể là Ngư dân.
whuber

Tôi đã tự hỏi nếu câu trả lời được đăng ở đây cũng sẽ được áp dụng trên các bản phân phối beta. Cảm ơn.
JLT

@JLT: Vâng, tại sao không?
Scortchi - Phục hồi Monica

Câu trả lời:


12

Nếu chúng ta xem xét nghiệm chính xác 2x2 và coi đó là cách tiếp cận của chúng ta, thì "cực đoan hơn" có thể được đo trực tiếp bằng 'khả năng thấp hơn'. (Agresti [1] đề cập đến một số cách tiếp cận của các tác giả khác nhau để tính toán hai giá trị p đuôi chỉ trong trường hợp thử nghiệm chính xác 2x2 Fisher này, trong đó phương pháp này là một trong ba cách tiếp cận được thảo luận cụ thể là 'phổ biến nhất'.)

Đối với phân phối liên tục (không chính thống), bạn chỉ cần tìm điểm ở đuôi khác có cùng mật độ với giá trị mẫu của bạn và mọi thứ có khả năng bằng hoặc thấp hơn ở đuôi kia được tính trong giá trị p của bạn.

Đối với các bản phân phối riêng biệt không đơn điệu ở đuôi, nó chỉ đơn giản như vậy. Bạn chỉ cần đếm tất cả mọi thứ với khả năng bằng hoặc thấp hơn mẫu của bạn, đưa ra các giả định mà tôi đã thêm (để làm cho thuật ngữ "đuôi" phù hợp với ý tưởng), đưa ra cách giải quyết.

Nếu bạn quen thuộc với các khoảng HPD (và một lần nữa, chúng ta đang đối phó với sự không đồng nhất), về cơ bản, nó giống như lấy mọi thứ bên ngoài một khoảng HPD mở được giới hạn trong một đuôi theo thống kê mẫu của bạn.

nhập mô tả hình ảnh ở đây

[Để nhắc lại - đây là khả năng theo null chúng tôi đang đánh đồng ở đây.]

Vì vậy, ít nhất là trong trường hợp không chính thống, có vẻ như đủ đơn giản để mô phỏng thử nghiệm chính xác của Fisher và vẫn nói về hai cái đuôi.

Tuy nhiên, bạn có thể không có ý định thực hiện tinh thần kiểm tra chính xác của Fisher theo cách này.

Vì vậy, suy nghĩ bên ngoài ý tưởng về những gì tạo ra một cái gì đó "như, hoặc cực đoan hơn" trong một khoảnh khắc, chúng ta hãy đi một chút về phía kết thúc của Neyman-Pearson. Nó có thể giúp (trước khi bạn kiểm tra!) Để thiết lập về việc xác định vùng từ chối cho thử nghiệm được tiến hành ở một mức chung nào đó (Tôi không có nghĩa là bạn phải tính toán theo nghĩa đen, chỉ là cách bạn sẽ tính toán một vùng). Ngay sau khi bạn làm, cách tính hai giá trị p đuôi cho trường hợp của bạn sẽ trở nên rõ ràng.α

Cách tiếp cận này có thể có giá trị ngay cả khi một người đang tiến hành một thử nghiệm bên ngoài thử nghiệm tỷ lệ khả năng thông thường. Đối với một số ứng dụng, có thể khó tìm ra cách tính giá trị p trong các phép thử hoán vị bất đối xứng ... nhưng nó thường trở nên đơn giản hơn đáng kể nếu bạn nghĩ về quy tắc từ chối trước tiên.

Với các thử nghiệm phương sai F, tôi đã nhận thấy rằng "giá trị p kép một đuôi" có thể cung cấp các giá trị p khá khác nhau cho những gì tôi thấy là cách tiếp cận phù hợp. [Không quan trọng bạn gọi nhóm nào là "mẫu 1", hoặc bạn đặt phương sai lớn hơn hay nhỏ hơn trong tử số.]

[1]: Agresti, A. (1992),
Một khảo sát về suy luận chính xác cho các bảng dự phòng
Khoa học thống kê , Tập. 7 , số 1. (tháng 2), trang 131-153.


1
ctd ... Nếu chúng tôi thực hiện kiểm tra tỷ lệ khả năng, tỷ lệ khả năng luôn luôn là một lần, nhưng nếu chúng tôi xây dựng một thử nghiệm hai đuôi tương đương dựa trên một số thống kê thì chúng tôi vẫn xem xét tỷ lệ khả năng nhỏ hơn để xác định "cực đoan hơn"
Glen_b -Reinstate Monica

2
Nhân đôi giá trị p một đầu có thể được bảo vệ như một hiệu chỉnh Bonferroni để thực hiện hai thử nghiệm một đầu. Rốt cuộc, sau một thử nghiệm hai đuôi, chúng ta thường rất có xu hướng coi bất kỳ nghi ngờ nào về sự thật của null là ủng hộ một giả thuyết khác có hướng được xác định bởi dữ liệu.
Scortchi - Phục hồi Monica

1
@Alecos nó đủ đơn giản để biện minh cho sự lựa chọn đối xứng! Tôi cảm thấy khó khăn khi thấy cách bạn đọc những gì tôi đã viết khi đề xuất lựa chọn đối xứng theo bất kỳ cách nào không phải là điều hợp lệ (lựa chọn đó được đề cập trong cuộc thảo luận tôi đã đưa ra về quy tắc từ chối - bạn có thể dễ dàng xây dựng một đối xứng quy tắc từ chối). Phần đầu tiên trong câu trả lời của tôi là trả lời phần trong câu hỏi về Fisher. Nếu bạn hỏi về Fisher, tôi không nên thảo luận về những gì có vẻ như Fisher có thể làm, dựa trên những gì anh ta đã làm trong hoàn cảnh tương tự? Bạn dường như giải thích phản ứng của tôi là nói nhiều hơn nó.
Glen_b -Reinstate Monica

1
@ Alecos Cụ thể, tôi không ủng hộ cách tiếp cận của Fisher, hoặc Neyman Pearson (cho dù chúng ta đang nói về các thử nghiệm tỷ lệ khả năng hay chỉ là các thử nghiệm giả thuyết nói chung), bạn cũng không nên coi tôi là cố gắng cho rằng bất cứ điều gì tôi bỏ qua có thể sai . Tôi chỉ đang thảo luận về một số điều mà bạn dường như đang nêu ra trong câu hỏi của bạn.
Glen_b -Reinstate Monica

2
Cuối cùng, có. Điều thú vị về cách tiếp cận của Fisher là nó mang lại một cách rất hợp lý để đạt đến giá trị p mà không cần phải có phương án thay thế. Nhưng nếu bạn có các lựa chọn thay thế quan tâm cụ thể, bạn có thể nhắm mục tiêu khu vực từ chối của mình chính xác hơn hoặc ít hơn đến các lựa chọn thay thế đó bằng cách khai báo các phần của không gian mẫu nơi các lựa chọn thay thế sẽ có xu hướng đặt các mẫu của bạn làm vùng từ chối. Một thống kê kiểm tra, T, là một cách thuận tiện để đạt được điều đó, về bản chất bằng cách liên kết một số duy nhất với mỗi điểm trong đó (cho chúng ta một 'cực đoan hơn' được đo bằng T). ... ctd
Glen_b -Reinstate Monica

9

STST= =|S|

S 2 tt= =tối thiểu(PrH0(S<S),PrH0(S>S))S2t

Khi có phân phối liên tục, cách tiếp cận để tạo một thử nghiệm hai đuôi được hiển thị bởi @ Glen_b, xác định mật độ của là thống kê kiểm tra: Tất nhiên sẽ tạo ra các giá trị p hợp lệ; nhưng tôi không chắc chắn rằng nó đã từng được đề xuất bởi Fisher, hoặc hiện tại nó được đề xuất bởi những người mới đánh cá. Nếu thoạt nhìn, nó có vẻ nguyên tắc hơn bằng cách nhân đôi giá trị p một đầu, lưu ý rằng phải xử lý mật độ xác suất thay vì khối lượng có nghĩa là giá trị p hai đuôi được tính toán có thể thay đổi khi thống kê kiểm tra là biến đổi bởi một chức năng bảo quản trật tự. Ví dụ: nếu để kiểm tra null mà giá trị trung bình của Gaussian bằng với vô nghĩa, bạn thực hiện một quan sát duy nhất và thu đượcSST= =fS(S)X1,66, giá trị có mật độ bằng nhau ở đuôi khác là và do đó giá trị do đóNhưng nếu bạn coi nó là kiểm tra null thì giá trị trung bình hình học log-Gauss bằng với một và thực hiện một quan sát duy nhất & thu được , giá trị có mật độ bằng nhau ở đuôi khác là ( ), và giá trị do đó-1,66

p= =Pr(X>1,66)+Pr(X<-1,66)= =0,048456+0,048456= =0,09691.
Ye1,66= =5.25930,025732= =e-3,66
p= =Pr(Y>5.2593)+Pr(Y<0,025732)= =0,048456+0,00012611= =0,04858.

nhập mô tả hình ảnh ở đây

Lưu ý rằng các hàm phân phối tích lũy là bất biến đối với các phép biến đổi bảo toàn thứ tự, do đó, trong ví dụ trên nhân đôi giá trị p thấp nhất sẽ cho

p= =2t= =2tối thiểu(Pr(X<1,66),Pr(X>1,66))= =2tối thiểu(Pr(Y<5.2593),Pr(Y>5.2593))= =2tối thiểu(0,048456,0,951543)= =2×0,048456= =0,09691.

Một loại phần tiếp theo của câu trả lời này, thảo luận về một số nguyên tắc xây dựng thử nghiệm trong đó giả thuyết thay thế được nêu rõ ràng, có thể được tìm thấy ở đây .

Khi có phân phối rời rạc, viếtS

pL= =PrH0(SS)
pBạn= =PrH0(SS)

đối với các giá trị p một đầu dưới và trên, giá trị p hai đuôi được đưa ra bởi

Pr(Tt)= ={pL+PrH0(PBạnpL)khi nào pLpBạnpBạn+PrH0(PLpBạn)nếu không thì

; tức là bằng cách thêm vào giá trị p một đầu nhỏ hơn, giá trị p có thể đạt được lớn nhất ở đuôi khác không vượt quá nó. Lưu ý rằng vẫn là giới hạn trên.2t


1
Tuyệt vời. Đây là một điểm rất tốt, +1. Lời khuyên của bạn sau đó là gì? Ngoài ra, tôi có thể diễn giải sự khác biệt này tương ứng với các lựa chọn khác nhau (trong trường hợp này là ngầm) về thống kê kiểm tra không?
amip nói rằng Tái lập Monica

1
@amoeba: Không phải là một lỗi đánh máy! Và khi bạn quan sát 1,66, bạn lấy mức tối thiểu là 0,952 & 0,048. Nếu bạn thực sự quan sát -3,66, nó sẽ là tối thiểu 0,0001 & 0,9999.
Scortchi - Phục hồi Monica

1
@Scortchi Tôi vừa chấp nhận câu trả lời của Glen_b vì nó "hữu ích" hơn theo nghĩa hẹp. Nhưng bạn đã giúp tôi tránh được cái bẫy nghĩ rằng "đó là tất cả", đó là một chính sách bảo hiểm tuyệt vời cho những rủi ro trong tương lai. Cảm ơn một lần nữa.
Alecos Papadopoulos

1
@Scortchi Tôi phải đồng ý; câu trả lời của tôi có một cái nhìn khá đơn giản và một chiều, và tôi nên đủ điều kiện, mở rộng và biện minh cho câu trả lời. Có lẽ tôi sẽ làm điều đó trong nhiều giai đoạn.
Glen_b -Reinstate Monica

1
@Glen_b: Cảm ơn, tôi mong chờ nó. Tôi cũng muốn mở rộng của tôi để cho thấy các bài kiểm tra điểm số và các bài kiểm tra tỷ lệ khả năng tổng quát đưa ra các câu trả lời khác nhau (nói chung); & lý thuyết về các bài kiểm tra không thiên vị chắc chắn đáng được đề cập trong bối cảnh này (nhưng tôi hầu như không thể nhớ nó).
Scortchi - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.