Sức mạnh của thử nghiệm hương vị trà


9

Trong nổi tiếng nghiệm Fisher các quan sát được là số hiệu chỉnh đoán cốc có hai loại cốc MộtB . Thông thường, thật thú vị khi tính toán khu vực quan trọng để bác bỏ giả thuyết khống (người phụ nữ đoán ngẫu nhiên) với kích thước của phép thử α . Điều này được thực hiện dễ dàng bằng cách sử dụng phân phối siêu bội. Theo cùng một cách tôi có thể tính kích thước của bài kiểm tra cho khu vực quan trọng.kABα

Một câu hỏi khác là: làm thế nào để tính toán sức mạnh của bài kiểm tra, đưa ra một giả thuyết thay thế? Ví dụ, giả sử rằng người phụ nữ có thể đoán chính xác với xác suất trên cốc đơn ( P ( đoán A | true A ) = P ( đoán  B | true  B ) = 0.9 ). Sức mạnh của phép thử là bao nhiêu, giả sử tổng số cốc bằng N = 8 và tổng số cốc một loại n = N / 2 = 4p=90%P(guessA|trueA)=P(guess B|true B)=0.9N=8n=N/2=4? (Thật không may) người phụ nữ biết .n

Nói cách khác: phân phối (số cốc đúng theo giả thuyết thay thế) là gì nếu người phụ nữ biết rằng có n cốc một loại?k=n


0.94=0.6561

N=8N8

1
Đây là một vấn đề thú vị, nhưng khó khăn. Thật dễ dàng để xác định các bảng sẽ dẫn đến từ chối Ho, nhưng sẽ phải suy nghĩ về xác suất nhìn thấy các bảng đó dưới Ha. Bài viết sau đây tính toán sức mạnh cho một bảng được sửa đổi một chút với độ nhạy và độ đặc hiệu nhất định: "Tổng quát hóa thủ tục nếm thử trà để liên kết các phương pháp định tính và định lượng trong nghiên cứu tâm thần" của Falissard et al. Tôi không chắc nếu tính toán là chính xác. Nếu bạn thực sự có vấn đề về nhị thức, thì bạn có thể sử dụng gói Exact R, nhưng đây là một vấn đề khác được hỏi
Peter Calhoun

Câu trả lời:


3

Theo cách khác, người phụ nữ không đoán ngẫu nhiên, nhưng "không đoán ngẫu nhiên" bao gồm vô số tình huống khác nhau. Cô ấy có thể luôn đoán hoàn hảo hoặc cô ấy chỉ có thể làm tốt hơn một chút so với đoán ngẫu nhiên ... và trong trường hợp chung, thậm chí không có một "thang đo" biến không ngẫu nhiên nào hoạt động (vì vậy chúng tôi thậm chí không có sức mạnh đường cong trừ khi chúng tôi hạn chế các loại phản ứng không ngẫu nhiên mà cô ấy có thể đưa ra).

Vì vậy, để tính toán một sức mạnh, chúng ta phải rất cụ thể về cách nó không ngẫu nhiên (và nó không ngẫu nhiên như thế nào trong thời trang cụ thể đó).

(,)μ0σ2=1/ω2ω2μ1σ2μ1=μ0=1

Đó là một loại mô hình cụ thể để làm thế nào cô ấy có thể thực hiện "tốt hơn ngẫu nhiên" mà chúng tôi có thể chỉ định các tham số và có được giá trị cho công suất.

Tất nhiên chúng ta có thể giả sử nhiều dạng không ngẫu nhiên khác hơn thế này.


3

Phân phối số lần đoán chính xác theo giả thuyết thay thế tuân theo phân phối siêu bội không trung tâm , được tham số hóa theo tỷ lệ chênh lệch, nghĩa là tỷ lệ cược mà người phụ nữ sẽ đoán "trà trước" cao hơn bao nhiêu thực tế trà đã được thêm vào đầu tiên trái ngược với khi thực tế sữa được thêm vào trước (hoặc ngược lại). Nếu tỷ lệ cược là 1, thì chúng ta có được phân phối siêu bội trung tâm.

Hãy xem điều này có hiệu quả không. Tôi sẽ sử dụng R cho mục đích minh họa, sử dụng MCMCpackgói có chức năng dnoncenhypergeom()tính toán mật độ của phân bố siêu bội (không trung tâm). Nó có lập luận xcho con số chính xác của dự đoán (cẩn thận: đây là con số chính xác của dự đoán theo một trong hai điều kiện, ví dụ, khi chè đã thực sự bổ sung đầu tiên), lập luận n1, n2m1cho ba trong bốn lề, và psicho tỷ lệ cược thực sự. Hãy tính mật độ xbằng 0 đến 4 (với tất cả các lề bằng 4) khi tỷ lệ cược thực là 1:

install.packages("MCMCpack")
library(MCMCpack)
sapply(0:4, function(x) dnoncenhypergeom(x, n1=4, n2=4, m1=4, psi=1))

Sản lượng này:

[1] 0.01428571 0.22857143 0.51428571 0.22857143 0.01428571

Vì vậy, có 1,43% cơ hội người phụ nữ sẽ đưa ra 8 lần đoán đúng (nghĩa là cô ấy đoán đúng cả 4 cốc khi trà được thêm vào trước và do đó cô cũng đoán đúng cả 4 cốc khi sữa được thêm vào trước) theo giả thuyết null. Trên thực tế, đây là lượng bằng chứng mà Fisher coi là đủ để bác bỏ giả thuyết khống.

(.90/(1.90))/(.10/(1.10))=81odds(guessA|trueA)/odds(guessA|trueB)). Bây giờ cơ hội nào mà người phụ nữ sẽ đoán đúng tất cả 8 cốc (nghĩa là cô ấy sẽ đoán đúng cả 4 cốc, nơi trà được thêm vào trước và do đó cũng là 4 cốc chính xác khi sữa được thêm vào trước)?

dnoncenhypergeom(4, n1=4, n2=4, m1=4, psi=81)

Sản lượng này:

[1] 0.8312221

Vậy là sức mạnh khoảng 83% rồi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.