Tính toán công suất / cỡ mẫu cho nghiên cứu biomarker


13

Chúng tôi có một dấu ấn sinh học tiềm năng để dự đoán liệu một bệnh nhân có bị ung thư hay không. Kết quả xét nghiệm biomarker là nhị phân dương tính hoặc âm tính. Chúng tôi muốn có được một số ý nghĩa về số lượng bệnh nhân cần được kiểm tra để xác định xem liệu dấu ấn sinh học này có phải là một dự đoán tốt hay không.

Từ việc đọc trên internet, dường như cách để đi là xem xét độ nhạy (đối với số lượng các trường hợp) và tính đặc hiệu (đối với số lượng điều khiển). Có ý kiến ​​cho rằng bạn nên coi tình huống này là thử nghiệm tỷ lệ một mẫu, nhưng vẫn chưa rõ bạn nên ước tính mức độ nhạy cảm và phạm vi bạn chuẩn bị ngoại trừ. Nếu nói tôi coi bất kỳ dấu ấn sinh học nào có độ nhạy lớn hơn 0,8 là "tốt", làm thế nào bạn đặt hai biến lên? Tôi muốn giả thuyết khống của tôi là dấu ấn sinh học không tốt hơn một bài tập ngẫu nhiên, tức là độ nhạy 0,5. Bất cứ ai cũng có thể đưa ra một ví dụ về cách tốt nhất để làm điều này (đặc biệt nếu nó ở trong R).


Bạn đang nói rằng bạn sẽ bắt đầu với một tập hợp các trường hợp đã biết, tiếp theo thực hiện kiểm tra dấu ấn sinh học của bạn (thu thập dữ liệu) và ước tính độ nhạy? Và bạn sẽ bắt đầu với một tập hợp các điều khiển đã biết, thu thập dữ liệu và ước tính độ đặc hiệu?

Đối với tính toán này có hiệu lực có. Trong thực tế, chúng tôi sẽ không biết trước khi tuyển dụng bệnh nhân, nhưng sẽ tiếp tục tuyển dụng cho đến khi chúng tôi có đủ trường hợp và kiểm soát. Ngoài ra, chúng tôi có một tỷ lệ ước tính rằng một bệnh nhân sẽ là một trường hợp vì vậy chúng tôi có thể sử dụng điều đó để ước tính tổng số lượng chúng tôi sẽ cần tuyển dụng,
danielsbrewer

Nếu dấu ấn sinh học chỉ đưa ra câu trả lời có / không thì bạn có thể đi với độ nhạy / độ đặc hiệu và lập kế hoạch trong bối cảnh để kiểm tra tỷ lệ. Nếu một giá trị cho một trong số chúng là "tốt" hay "xấu" phụ thuộc vào hậu quả thực tế của một quyết định sai lầm. Nếu dấu ấn sinh học ban đầu cho phép đo liên tục thì các đường cong ROC và thống kê AUC và các phương pháp lập kế hoạch cỡ mẫu tương ứng có thể phù hợp hơn. Nhưng tất cả điều này chỉ làm trầy xước bề mặt của các phương pháp được kết nối với thử nghiệm chẩn đoán ...
psj

Câu trả lời:


11

Hãy nói về độ nhạy (mà chúng ta sẽ biểu thị bằng ), tính đặc hiệu là tương tự nhau. Sau đây là một cách tiếp cận thường xuyên; sẽ thật tuyệt nếu một trong những người Bayes ở đây có thể thêm một câu trả lời khác để thảo luận về một cách khác để đi về nó.p

Giả sử bạn đã tuyển người bị ung thư. Bạn áp dụng thử nghiệm dấu ấn sinh học của mình cho từng loại, do đó bạn sẽ nhận được một chuỗi 0 và 1 mà chúng tôi sẽ gọi . Các mục của sẽ có phân phối Bernoulli với xác suất thành công p . Ước tính của pp = Σ x / n . Hy vọng rằng p là "lớn", và bạn có thể đánh giá độ chính xác của ước tính của bạn thông qua một khoảng tin cậy cho p . nxxppp^= =Σx/np^p

Câu hỏi của bạn nói rằng bạn muốn biết nên lớn như thế nào . Để trả lời, bạn sẽ cần tham khảo tài liệu về dấu ấn sinh học để quyết định mức độ "lớn" và mức độ nhạy cảm mà bạn có thể chịu đựng do lỗi lấy mẫu. Giả sử bạn quyết định rằng dấu ấn sinh học là "tốt" nếu độ nhạy của nó lớn hơn p = 0,5 (điều đó thực sự không tốt lắm) và bạn muốn n đủ lớn để có 90% cơ hội phát hiện độ nhạy của p = 0,57 . Giả sử bạn muốn kiểm soát mức ý nghĩa của mình ở mức α = 0,05 . np= =0,5np= =0,57α= =0,05

Có ít nhất hai cách tiếp cận - phân tích và mô phỏng. Các pwrgói tại Rđã tồn tại để giúp đỡ với thiết kế này - bạn cần phải cài đặt nó đầu tiên. Tiếp theo bạn sẽ cần một kích thước hiệu ứng, sau đó chức năng bạn muốn là pwr.p.test.

library(pwr)
h1 <- ES.h(0.57, 0.5)
pwr.p.test(h = h1, n = NULL, sig.level = 0.05, power = 0.9, alt = "greater")

     proportion power calculation for binomial distribution (arc... 

              h = 0.1404614
              n = 434.0651
      sig.level = 0.05
          power = 0.9
    alternative = greater

Vì vậy, bạn cần khoảng người bị ung thư để phát hiện độ nhạy 0,57 với sức mạnh 0,90 khi mức ý nghĩa của bạn là 0,05 . Tôi cũng đã thử phương pháp mô phỏng, và nó cũng cho một câu trả lời tương tự. Tất nhiên, nếu độ nhạy thực sự cao hơn 0,57 (dấu ấn sinh học của bạn tốt hơn) thì bạn sẽ cần ít người hơn để phát hiện ra nó.4350,570,900,050,57

Khi bạn đã có dữ liệu của mình, cách để chạy thử nghiệm là (Tôi sẽ mô phỏng dữ liệu để tranh luận).

n <- 435
sens <- 0.57
x <- rbinom(n, size = 1, prob = sens)
binom.test(sum(x), n, p = 0.5, alt = "greater")

    Exact binomial test

data:  sum(x) and n 
number of successes = 247, number of trials = 435,
p-value = 0.002681
alternative hypothesis: true probability of success is greater than 0.5 
95 percent confidence interval:
 0.527342 1.000000 
sample estimates:
probability of success 
             0.5678161 

0,568p[0,527,1]

EDIT: Nếu bạn thích phương pháp mô phỏng tốt hơn, thì bạn có thể làm theo cách này: set

n <- 435
sens <- 0.57
nSim <- 1000

và hãy runTest

runTest <- function(){
  x <- rbinom(1, size = n, prob = sens)
  tmp <- binom.test(x, n, p = 0.5, alt = "greater")
  tmp$p.value < 0.05
}

vì vậy ước tính sức mạnh là

mean(replicate(nSim, runTest()))
[1] 0.887
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.