Kiểm tra thống kê cho giá trị tiên đoán tích cực và tiêu cực


12

Tôi đang đọc qua một tờ giấy và tôi thấy một bảng có so sánh giữa PPV (Giá trị dự đoán tích cực) và NPV (Giá trị dự đoán tiêu cực). Họ đã làm một số loại kiểm tra thống kê cho họ, đây là một bản phác thảo của bảng:

PPV    NPV    p-value
65.9   100    < 0.00001
...

Mỗi hàng đề cập đến một bảng dự phòng cụ thể.

Những loại kiểm tra giả thuyết họ đã làm gì? Cảm ơn!

Câu trả lời:


17

Giả sử phân loại chéo giống như phân loại dưới đây (ở đây, cho một công cụ sàng lọc)

văn bản thay thế

chúng ta có thể định nghĩa bốn biện pháp sàng lọc độ chính xác và sức mạnh dự đoán:

  • Độ nhạy (se), a / (a ​​+ c), nghĩa là xác suất của màn hình cung cấp kết quả dương tính cho thấy bệnh có mặt;
  • Độ đặc hiệu (sp), d / (b + d), nghĩa là xác suất của màn hình cung cấp kết quả âm tính cho thấy bệnh không có;
  • Giá trị tiên đoán dương tính (PPV), a / (a ​​+ b), nghĩa là xác suất bệnh nhân có kết quả xét nghiệm dương tính được chẩn đoán chính xác (là dương tính);
  • Giá trị tiên đoán âm tính (NPV), d / (c + d), tức là xác suất bệnh nhân có kết quả xét nghiệm âm tính được chẩn đoán chính xác (là âm tính).

Mỗi bốn biện pháp là tỷ lệ đơn giản được tính toán từ dữ liệu quan sát được. Do đó, một thử nghiệm thống kê phù hợp sẽ là một thử nghiệm nhị thức (chính xác) , có sẵn trong hầu hết các gói thống kê hoặc nhiều máy tính trực tuyến. Giả thuyết được thử nghiệm là liệu tỷ lệ quan sát được có khác biệt đáng kể so với 0,5 hay không. Tuy nhiên, tôi thấy thú vị hơn khi cung cấp các khoảng tin cậy thay vì một thử nghiệm quan trọng duy nhất, vì nó cung cấp thông tin về độ chính xác của phép đo. Dù sao, để tái tạo kết quả bạn đã hiển thị, bạn cần biết tổng tỷ suất lợi nhuận của bảng hai chiều của mình (bạn chỉ đưa PPV và NPV là%).

Ví dụ: giả sử rằng chúng tôi quan sát các dữ liệu sau (bảng câu hỏi CAGE là một câu hỏi sàng lọc cho rượu):

văn bản thay thế

sau đó trong R, PPV sẽ được tính như sau:

> binom.test(99, 142)

    Exact binomial test

data:  99 and 142 
number of successes = 99, number of trials = 142, p-value = 2.958e-06
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.6145213 0.7714116 
sample estimates:
probability of success 
             0.6971831 

Nếu bạn đang sử dụng SAS, thì bạn có thể xem Lưu ý sử dụng 24170: Làm cách nào tôi có thể ước tính độ nhạy, độ đặc hiệu, giá trị tiên đoán dương và âm, xác suất dương và âm sai và tỷ lệ khả năng? .

Để tính các khoảng tin cậy, xấp xỉ gaussian, (1.96 là định lượng của phân phối chuẩn thông thường tại hoặc với %), được sử dụng trong thực tế, đặc biệt khi tỷ lệ khá nhỏ hoặc lớn (thường là trường hợp ở đây).p±1,96×p(1-p)/np= =0,9751-α/2α= =5

Để tham khảo thêm, bạn có thể nhìn vào

Newcombe, RG. Khoảng tin cậy hai mặt cho tỷ lệ đơn: So sánh bảy phương pháp . Thống kê trong Y học , 17, 857-872 (1998).


Cảm ơn. Ok, tôi đã đọc ngay từ đầu bài báo rằng họ đã sử dụng kiểm tra Chi bình phương cho tất cả các biến phân loại. Bảng phân loại được viết không đề cập đến một biến cụ thể, đó là đầu ra của một nhiệm vụ phân loại. Nó không rõ ràng lắm! Bây giờ tôi cho rằng họ đã làm một bài kiểm tra cổ điển về tỷ lệ .. có thể là Chi-vuông ..
Simone

Tôi đã xem lại câu hỏi này một lần nữa và tôi đã thấy rằng giá trị p không đề cập đến cả PPV hay NPV, nó đề cập đến toàn bộ hàng. Tôi nghĩ rằng bài kiểm tra mà họ có nên được liên kết với toàn bộ bảng dự phòng.
Simone

@Simone Vì vậy, nếu tôi hiểu bạn một cách chính xác, bạn đề nghị các tác giả cung cấp giá trị PPV và NPV nhưng đã cho giá trị p tương ứng với thử nghiệm liên kết toàn cầu của bảng 2x2? Có liên quan đến câu hỏi gần đây này không, stats.stackexchange.com/questions/9464/ ?
chl

Có, nó sẽ liên quan đến câu hỏi đó nếu giá trị p được liên kết với PPV hoặc NPV. Và trong trường hợp đó bạn đã đưa ra giải pháp. Bài kiểm tra tương ứng với toàn bộ bảng 2x2, tôi sẽ không bao giờ biết đó là bài kiểm tra nào!
Simone

1

Xin vui lòng xem

Kosinski, Andrzej S. Một thống kê điểm tổng quát có trọng số để so sánh các giá trị tiên đoán của các xét nghiệm chẩn đoán. Thống kê trong Y học http://dx.doi.org/10.1002/sim.5587 được công bố trực tuyến: 22 AUG 2012

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.