Nếu phân phối thống kê kiểm tra là lưỡng kim, giá trị p có nghĩa gì không?


12

Giá trị P được xác định xác suất đạt được thống kê kiểm tra ít nhất là cực đoan như những gì được quan sát, giả sử null giả thuyết là đúng. Nói cách khác,

P(Xt|H0)
Nhưng nếu thống kê kiểm tra là lưỡng kim trong phân phối thì sao? giá trị p có nghĩa gì trong bối cảnh này không? Ví dụ, tôi sẽ mô phỏng một số dữ liệu lưỡng kim trong R:
set.seed(0)
# Generate bi-modal distribution
bimodal <- c(rnorm(n=100,mean=25,sd=3),rnorm(n=100,mean=100,sd=5)) 
hist(bimodal, breaks=100)

nhập mô tả hình ảnh ở đây

Và giả sử chúng ta quan sát giá trị thống kê kiểm tra là 60. Và ở đây chúng ta biết từ hình ảnh giá trị này rất khó xảy ra . Rất lý tưởng, tôi muốn một quy trình thống kê mà tôi sử dụng (giả sử giá trị p) để tiết lộ điều này. Nhưng nếu chúng ta tính toán giá trị p như được xác định, chúng ta sẽ nhận được giá trị p khá cao

observed <- 60

# Get P-value
sum(bimodal[bimodal >= 60])/sum(bimodal)
[1] 0.7991993

Nếu tôi không biết phân phối, tôi sẽ kết luận rằng những gì tôi quan sát được chỉ đơn giản là do cơ hội ngẫu nhiên. Nhưng chúng tôi biết điều này không đúng.

Tôi đoán câu hỏi tôi có là: Tại sao, khi tính toán giá trị p, chúng ta có tính toán xác suất cho các giá trị "ít nhất là cực kỳ như" quan sát được không? Và nếu tôi gặp phải một tình huống như tình huống tôi mô phỏng ở trên, giải pháp thay thế là gì?


7
Chào mừng bạn đến với thế giới tuyệt vời của Thử nghiệm Ý nghĩa Giả thuyết Null! Nghiêm túc: Tôi thực sự không thể nghĩ ra một thống kê kiểm tra có phân phối lưỡng kim theo giả thuyết null (đó là điều mà chúng tôi quan tâm trong NHST). Vì vậy, +1 cho một câu hỏi thú vị, nhưng tôi nghi ngờ về sự phù hợp thực tế của nó ... trừ khi bạn có một ví dụ cụ thể trong đầu?
Stephan Kolassa

1
Tôi đồng ý với @StephanKolassa; chắc chắn có sự phân phối dữ liệu là lưỡng kim, nhưng thống kê kiểm tra là gì?
Peter Flom - Tái lập Monica

7
Tôi sẽ không đồng ý với đặc tính của các giá trị p được đề xuất bởi công thức đầu tiên. Ý nghĩa chính xác của "ít nhất là cực đoan" trong lý thuyết Neyman-Pearson là về khả năng tương đối và không phải theo thứ tự thông thường của thực tế (như đã nêu trong công thức). Hai là tương đương trong nhiều tình huống thử nghiệm tiêu chuẩn nhưng khác nhau rõ rệt khi phân phối lấy mẫu là lưỡng kim. Do đó, sự phân biệt này sẽ giải quyết câu hỏi thỏa đáng, tôi nghĩ vậy.
whuber

@whuber Bạn có thể vui lòng giải thích về điều này một chút, có thể với một ví dụ đơn giản?
Szabolcs

2
Gθ(θ,θ)θ1Fθ(x)Gθ(x)Gθ(x)x[1,1]F1F2±1/2XFθH0:XF1 HA:XF2±11/21/2θ=2

Câu trả lời:


5

Điều gì làm cho một thống kê kiểm tra "cực đoan" phụ thuộc vào sự thay thế của bạn, trong đó áp đặt một thứ tự (hoặc ít nhất là một phần) trên không gian mẫu - bạn tìm cách từ chối những trường hợp nhất quán (theo nghĩa được đo bằng thống kê kiểm tra) với thay thế.

Khi bạn thực sự không giải pháp thay thế nào để cung cấp cho bạn một thứ gì đó phù hợp nhất, về cơ bản bạn sẽ có khả năng đưa ra thứ tự, thường thấy nhất trong thử nghiệm chính xác của Fisher. Ở đó, xác suất của các kết quả (các bảng 2x2) theo lệnh null là thống kê kiểm tra (sao cho 'cực trị' là 'xác suất thấp').

Nếu bạn ở trong một tình huống mà phía bên trái (hoặc ngoài cùng bên phải hoặc cả hai) của phân phối null hai chiều của bạn có liên quan đến loại thay thế mà bạn quan tâm, bạn sẽ không tìm cách từ chối thống kê kiểm tra 60. Nhưng nếu bạn đang ở trong một tình huống mà bạn không có một giải pháp thay thế như thế, thì 60 là không mong muốn - nó có khả năng thấp; giá trị 60 không phù hợp với mô hình của bạn và sẽ khiến bạn từ chối.

[Điều này sẽ được một số người coi là một khác biệt trung tâm giữa thử nghiệm giả thuyết Ngư dân và Neyman-Pearson. Bằng cách giới thiệu một giải pháp thay thế rõ ràng và tỷ lệ khả năng, khả năng thấp theo null sẽ không nhất thiết khiến bạn từ chối trong khung Neyman-Pearson (miễn là nó hoạt động tương đối tốt so với giải pháp thay thế), trong khi đối với Fisher, bạn không thực sự có một lựa chọn thay thế và khả năng dưới null là điều bạn quan tâm.]

Tôi không đề xuất một trong hai cách tiếp cận là đúng hay sai ở đây - bạn hãy tiếp tục và tự mình tìm ra loại thay thế nào bạn tìm kiếm sức mạnh chống lại, cho dù đó là một cách cụ thể, hoặc bất cứ điều gì không đủ khả năng theo null. Một khi bạn biết những gì bạn muốn, phần còn lại (bao gồm cả những gì "ít nhất là cực đoan" có nghĩa là khá nhiều từ đó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.