Hãy nói về độ nhạy (mà chúng ta sẽ biểu thị bằng ), tính đặc hiệu là tương tự nhau. Sau đây là một cách tiếp cận thường xuyên; sẽ thật tuyệt nếu một trong những người Bayes ở đây có thể thêm một câu trả lời khác để thảo luận về một cách khác để đi về nó.p
Giả sử bạn đã tuyển người bị ung thư. Bạn áp dụng thử nghiệm dấu ấn sinh học của mình cho từng loại, do đó bạn sẽ nhận được một chuỗi 0 và 1 mà chúng tôi sẽ gọi . Các mục của sẽ có phân phối Bernoulli với xác suất thành công p . Ước tính của p là p = Σ x / n . Hy vọng rằng p là "lớn", và bạn có thể đánh giá độ chính xác của ước tính của bạn thông qua một khoảng tin cậy cho p . nx
x
ppp^= ∑ x / np^p
Câu hỏi của bạn nói rằng bạn muốn biết nên lớn như thế nào . Để trả lời, bạn sẽ cần tham khảo tài liệu về dấu ấn sinh học để quyết định mức độ "lớn" và mức độ nhạy cảm mà bạn có thể chịu đựng do lỗi lấy mẫu. Giả sử bạn quyết định rằng dấu ấn sinh học là "tốt" nếu độ nhạy của nó lớn hơn p = 0,5 (điều đó thực sự không tốt lắm) và bạn muốn n đủ lớn để có 90% cơ hội phát hiện độ nhạy của p = 0,57 . Giả sử bạn muốn kiểm soát mức ý nghĩa của mình ở mức α = 0,05 . np = 0,5np = 0,57α = 0,05
Có ít nhất hai cách tiếp cận - phân tích và mô phỏng. Các pwr
gói tại R
đã tồn tại để giúp đỡ với thiết kế này - bạn cần phải cài đặt nó đầu tiên. Tiếp theo bạn sẽ cần một kích thước hiệu ứng, sau đó chức năng bạn muốn là pwr.p.test
.
library(pwr)
h1 <- ES.h(0.57, 0.5)
pwr.p.test(h = h1, n = NULL, sig.level = 0.05, power = 0.9, alt = "greater")
proportion power calculation for binomial distribution (arc...
h = 0.1404614
n = 434.0651
sig.level = 0.05
power = 0.9
alternative = greater
Vì vậy, bạn cần khoảng người bị ung thư để phát hiện độ nhạy 0,57 với sức mạnh 0,90 khi mức ý nghĩa của bạn là 0,05 . Tôi cũng đã thử phương pháp mô phỏng, và nó cũng cho một câu trả lời tương tự. Tất nhiên, nếu độ nhạy thực sự cao hơn 0,57 (dấu ấn sinh học của bạn tốt hơn) thì bạn sẽ cần ít người hơn để phát hiện ra nó.4350,570,900,050,57
Khi bạn đã có dữ liệu của mình, cách để chạy thử nghiệm là (Tôi sẽ mô phỏng dữ liệu để tranh luận).
n <- 435
sens <- 0.57
x <- rbinom(n, size = 1, prob = sens)
binom.test(sum(x), n, p = 0.5, alt = "greater")
Exact binomial test
data: sum(x) and n
number of successes = 247, number of trials = 435,
p-value = 0.002681
alternative hypothesis: true probability of success is greater than 0.5
95 percent confidence interval:
0.527342 1.000000
sample estimates:
probability of success
0.5678161
0,568p[ 0,527 , 1 ]
EDIT: Nếu bạn thích phương pháp mô phỏng tốt hơn, thì bạn có thể làm theo cách này: set
n <- 435
sens <- 0.57
nSim <- 1000
và hãy runTest
là
runTest <- function(){
x <- rbinom(1, size = n, prob = sens)
tmp <- binom.test(x, n, p = 0.5, alt = "greater")
tmp$p.value < 0.05
}
vì vậy ước tính sức mạnh là
mean(replicate(nSim, runTest()))
[1] 0.887