Phân tích công suất cho dữ liệu nhị thức khi giả thuyết null là


10

Tôi muốn thực hiện phân tích công suất cho một mẫu từ dữ liệu nhị thức, với , so với H 1 : p = 0,001 , trong đó p là tỷ lệ thành công trong dân số. Nếu 0 < p < 1 , tôi có thể sử dụng xấp xỉ bình thường cho nhị thức hoặc χ 2 -test, nhưng với p = 0 , cả hai đều thất bại. Tôi muốn biết nếu có một cách để làm phân tích này. Tôi rất đánh giá cao bất kỳ đề xuất, ý kiến, hoặc tài liệu tham khảo. Cảm ơn nhiều!H0:p=0H1:p=0.001p0<p<1χ2p=0


Vậy tại sao bạn không sử dụng thử nghiệm Clopper-Pearson chính xác?
Stéphane Laurent

2
Tôi hy vọng bạn có một mẫu thực sự lớn! Điều này sẽ khó để kiểm tra.
Peter Flom - Tái lập Monica

Câu trả lời:


13

Bạn có một giả thuyết thay thế chính xác một phía trong đó p 1 = 0,001p 0 = 0 .p1>p0p1=0.001p0=0

  • ccnα=0.05c=1n1α>0
  • cnnB(n,p1)

n=500

> n  <- 500                 # sample size
> p1 <- 0.001               # success probability under alternative hypothesis
> cc <- 1                   # threshold
> sum(dbinom(cc:n, n, p1))  # power: probability for cc or more successes given p1
[1] 0.3936211

Để có được ý tưởng về cách năng lượng thay đổi với kích thước mẫu, bạn có thể vẽ hàm năng lượng: nhập mô tả hình ảnh ở đây

nn   <- 10:2000                 # sample sizes
pow  <- 1-pbinom(cc-1, nn, p1)  # corresponding power
tStr <- expression(paste("Power for ", X>0, " given ", p[1]==0.001))
plot(nn, pow, type="l", xaxs="i", xlab="sample size", ylab="power",
     lwd=2, col="blue", main=tStr, cex.lab=1.4, cex.main=1.4)

0.5

> powMin <- 0.5
> idx    <- which.min(abs(pow-powMin))  # index for value closest to 0.5
> nn[idx]     # sample size for that index
[1] 693

> pow[idx]    # power for that sample size
[1] 0.5000998

6930.5


Theo pwr.p.test, để có sức mạnh 0,5, bạn cần ít nhất 677 quan sát. Nhưng công suất = 0,5 là rất thấp!
Jessica

@caracal Bạn có đang sử dụng xấp xỉ bình thường để có được đường cong sức mạnh của mình không? Một hàm năng lượng nhị thức chính xác sẽ không được trơn tru như vậy. Nó thực sự là răng cưa mà bạn có thể thấy nếu trục kích thước mẫu được phóng to. Tôi thảo luận về điều này trong bài báo năm 2002 của tôi trong Nhà thống kê người Mỹ đồng tác giả với Christine Liu. Ngoài ra nhị thức rất lệch ở mức p rất thấp nên n phải lớn để phép gần đúng bình thường hoạt động tốt.
Michael R. Chernick

2
p0=0nc=1p1=0.001n

@Jessica Lưu ý rằng pwr.p.test()sử dụng xấp xỉ bình thường, không phải là phân phối nhị thức chính xác. Chỉ cần gõ pwr.p.testđể có một cái nhìn vào mã nguồn. Bạn sẽ tìm thấy các cuộc gọi để pnorm()chỉ ra rằng một xấp xỉ được sử dụng.
caracal

1
n1n

3

Bạn có thể trả lời câu hỏi này dễ dàng với pwrgói trong R.

Bạn sẽ cần xác định một mức ý nghĩa, sức mạnh và kích thước hiệu ứng. Thông thường, mức ý nghĩa được đặt thành 0,05 và công suất được đặt thành 0,8. Công suất cao hơn sẽ đòi hỏi nhiều quan sát hơn. Mức ý nghĩa thấp hơn sẽ giảm sức mạnh.

p=0.001

> ES.h(.001, 0)
[1] 0.0632561

Nhưng chúng ta vẫn có thể tiến hành.

 > pwr.p.test(sig.level=0.05, power=.8, h = ES.h(.001, 0), alt="greater", n = NULL)

 proportion power calculation for binomial distribution (arcsine transformation) 

          h = 0.0632561
          n = 1545.124
  sig.level = 0.05
      power = 0.8
alternative = greater

Sử dụng các giá trị này, bạn cần ít nhất 1546 quan sát.


1

Trong trường hợp cụ thể của bạn, có một giải pháp chính xác đơn giản:

H0:p=0p0

H1:p=0.0011β

1β1(1p)(k1)

p=0.00180


Khi đọc các bình luận cho giải pháp 1, tôi nhận ra rằng về cơ bản đây là giải pháp tương tự như giải pháp bạn nhận được nếu dính vào câu trả lời. Tuy nhiên, nó không bao giờ có hại khi đánh vần một số kết quả lý thuyết xác suất cơ bản, mà không cần phải đến đó bằng trực giác.
thả nổi
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.