Trong xử lý hình ảnh y tế, hầu hết các tác phẩm được xuất bản đều cố gắng giảm tỷ lệ dương tính giả (FPR) trong khi thực tế, âm tính giả lại nguy hiểm hơn so với dương tính giả. Lý do đằng sau nó là gì?
Trong xử lý hình ảnh y tế, hầu hết các tác phẩm được xuất bản đều cố gắng giảm tỷ lệ dương tính giả (FPR) trong khi thực tế, âm tính giả lại nguy hiểm hơn so với dương tính giả. Lý do đằng sau nó là gì?
Câu trả lời:
TL; DR: bệnh rất hiếm, vì vậy số lượng dương tính giả tuyệt đối nhiều hơn rất nhiều so với âm tính giả.
Giả sử rằng hệ thống của chúng tôi có cùng tỷ lệ âm tính giả và âm tính giả là 1% (khá tốt!) Và chúng tôi đang phát hiện sự hiện diện của bệnh ung thư mới trong năm nay: 439,2 / 100.000 người, hoặc 0,5% dân số. [ nguồn ]
Vì vậy, chúng ta có thể thấy rằng chúng ta có một vấn đề: đối với tất cả những người bị ung thư, hai người không bị ung thư sẽ phải phẫu thuật xâm lấn, hóa trị hoặc xạ trị.
Đối với mỗi người không phát hiện ra bệnh ung thư hiện tại, hai trăm người được điều trị có hại tích cực mà họ không cần và thực sự không đủ khả năng.
Bạn biết câu chuyện về cậu bé khóc sói phải không?
Đó là cùng một ý tưởng. Sau khi một số phân loại đưa ra báo động sai (sói khóc) rất nhiều lần, nhân viên y tế sẽ tắt hoặc bỏ qua nó.
"Ồ, cái này nữa! NOPE!"
Ít nhất là với nhóm nghiên cứu sinh học mà tôi đã làm việc, trọng tâm là giảm FPR đặc biệt vì mục tiêu là tạo ra một công cụ cảnh báo các bác sĩ về bệnh lý tiềm năng và họ đã nói với chúng tôi rằng họ sẽ bỏ qua một sản phẩm khóc sói quá nhiều.
Đối với một sản phẩm hỗ trợ các bác sĩ, chúng tôi phải lôi cuốn tâm lý của họ, bất chấp lập luận chính đáng rằng việc bỏ lỡ con sói trong trang trại còn tệ hơn cả sói khóc.
Chỉnh sửa : Giảm dương tính giả cũng có một lý lẽ hợp pháp. Nếu máy tính của bạn tiếp tục khóc sói trong khi thỉnh thoảng có kết quả dương tính thật sự (và nắm bắt hầu hết các tích cực thực sự), thì có hiệu quả nói rằng ai đó có thể bị bệnh. Họ đang ở trong bệnh viện. Bác sĩ biết rằng bệnh nhân có thể bị bệnh.
Tóm tắt: câu hỏi có lẽ * không phải là liệu một âm tính giả có tệ hơn một âm tính giả hay không, nó có thể * giống như liệu 500 dương tính giả có được chấp nhận để chuyển xuống một âm tính giả hay không.
* phụ thuộc vào ứng dụng
Hãy để tôi mở rộng một chút về câu trả lời của @ Dragon:
Sàng lọc có nghĩa là chúng ta đang tìm kiếm bệnh trong một dân số dường như khỏe mạnh. Như @Dragon đã giải thích, đối với những điều này, chúng ta cần FPR (hoặc độ nhạy cao) cực kỳ thấp, nếu không, chúng ta sẽ kết thúc với nhiều kết quả dương tính giả hơn là dương tính thật. Tức là, Giá trị Dự đoán Tích cực (# thực sự bị bệnh trong số tất cả các chẩn đoán dương tính) sẽ không thể chấp nhận được.
Độ nhạy (TPR) và Độ đặc hiệu (TNR) rất dễ đo lường đối với hệ thống chẩn đoán: lấy một số trường hợp thực sự (không) bị bệnh và đo tỷ lệ của những trường hợp được phát hiện chính xác.
OTOH, theo quan điểm của bác sĩ và bệnh nhân, các giá trị tiên đoán có nhiều điểm hơn. Chúng là "nghịch đảo" với Độ nhạy và độ đặc hiệu và cho bạn biết trong số tất cả các dự đoán tích cực (tiêu cực), phân số nào là chính xác. Nói cách khác, sau khi xét nghiệm cho biết "bệnh" thì xác suất bệnh nhân thực sự mắc bệnh là bao nhiêu.
Như @Dragon cho bạn thấy, tỷ lệ mắc (hoặc tỷ lệ lưu hành, tùy thuộc vào thử nghiệm mà chúng ta đang nói đến) đóng một vai trò quan trọng ở đây. Tỷ lệ mắc bệnh thấp trong tất cả các loại sàng lọc / ứng dụng chẩn đoán ung thư sớm.
Để minh họa điều này, sàng lọc ung thư buồng trứng cho phụ nữ sau mãn kinh có tỷ lệ 0,04% trong dân số nói chung và 0,5% ở phụ nữ có nguy cơ cao có tiền sử gia đình và / hoặc đột biến gen ức chế khối u BRCA1 và 2 [Buchen, L. Cự Giải: Mất dấu. Thiên nhiên, 2011, 471, 428-432]
Vì vậy, câu hỏi thường không phải là liệu một âm tính giả có tệ hơn một âm tính giả hay không, mà thậm chí độ đặc hiệu 99% (1% FPR) và độ nhạy 95% (các số được lấy từ bài báo được liên kết ở trên) có nghĩa là khoảng 500 dương tính giả cho mỗi âm tính giả .
Một lưu ý phụ, cũng nên nhớ rằng chẩn đoán ung thư sớm tự nó không phải là phương thuốc thần kỳ cho bệnh ung thư. Ví dụ như ung thư vú sàng lọc chụp nhũ ảnh, chỉ có 3-13% số đúng bệnh nhân dương tính thực sự được hưởng lợi từ việc kiểm tra .
Vì vậy, chúng ta cũng cần theo dõi số lượng dương tính giả cho mỗi bệnh nhân được hưởng lợi . Ví dụ, đối với chụp nhũ ảnh, cùng với những con số này , một phỏng đoán sơ bộ rằng chúng ta có một nơi nào đó trong phạm vi 400 - 1800 dương tính giả trên mỗi lợi ích tích cực thực sự (nhóm 39 - 49 tuổi).
Với hàng trăm dương tính giả trên mỗi âm tính giả (và cũng có thể hàng trăm hoặc thậm chí hàng nghìn dương tính giả trên mỗi bệnh nhân được hưởng lợi từ sàng lọc), tình huống không rõ ràng như "một bệnh ung thư bị bỏ sót tồi tệ hơn một chẩn đoán ung thư dương tính giả": dương tính giả có ảnh hưởng, từ tâm lý và tâm lý (lo lắng rằng bản thân bạn bị ung thư không khỏe mạnh) đến các rủi ro về thể chất của các chẩn đoán theo dõi như sinh thiết (là một phẫu thuật nhỏ, và như vậy đi kèm với chính nó rủi ro).
Ngay cả khi tác động của một dương tính giả là nhỏ, các rủi ro tương ứng có thể tăng lên đáng kể nếu hàng trăm dương tính giả phải được xem xét.
Đề nghị đọc: Gerd Gigerenzer: Rủi ro rủi ro: Cách đưa ra quyết định tốt (2014).
Tuy nhiên, những gì PPV và NPV cần thiết để làm cho xét nghiệm chẩn đoán hữu ích phụ thuộc nhiều vào ứng dụng.
Như đã giải thích, trong sàng lọc phát hiện ung thư sớm, trọng tâm thường tập trung vào PPV, tức là đảm bảo bạn không gây ra quá nhiều tác hại bởi âm tính giả: việc tìm ra một phần lớn (ngay cả khi không phải tất cả) của bệnh nhân ung thư sớm đã là một sự cải thiện hiện trạng mà không sàng lọc.
OTOH, xét nghiệm HIV trong hiến máu tập trung đầu tiên vào NPV (tức là đảm bảo máu không nhiễm HIV). Tuy nhiên, trong bước thứ 2 (và thứ 3), dương tính giả sau đó được giảm bằng cách áp dụng các xét nghiệm tiếp theo trước khi lo lắng cho những người có kết quả xét nghiệm HIV dương tính (sai).
Cuối cùng nhưng không kém phần quan trọng, cũng có những ứng dụng xét nghiệm y tế trong đó tỷ lệ mắc hoặc tỷ lệ mắc bệnh không nghiêm trọng như thường được sàng lọc trong các quần thể không có nguy cơ đặc biệt cao, ví dụ như một số chẩn đoán phân biệt.
Từ quan điểm cá nhân, thay vì kinh nghiệm khoa học dữ liệu, dương tính giả có tác động cao hơn đến chất lượng sống của bệnh nhân so với âm tính giả (ít nhất là trong hầu hết các ứng dụng xử lý hình ảnh y tế. Chúng tôi không nói về kết quả phòng thí nghiệm ở đây) .
Hãy xem xét một ví dụ cụ thể: sàng lọc khối u .
Một âm tính giả có nghĩa là một khối u ở giai đoạn đầu có nhiều thời gian hơn để phát triển và phát triển thành ung thư độc hại. Nhìn chung quá trình này mất nhiều thời gian và mỗi lần sàng lọc tiếp theo có cơ hội phát hiện ra nó cao hơn, nhưng thực tế sức khỏe lâu dài của bệnh nhân phải chịu đựng.
Ngoài ra, luôn có một người tham gia chẩn đoán. Xử lý hình ảnh y tế ở giai đoạn công nghệ hiện tại có nghĩa là một sự trợ giúp cho nhân viên y tế, không phải là một sự thay thế . Nó thường có nghĩa là chỉ ra các tổn thương hoặc thay đổi trong mô tinh tế đến mức con người có thể bỏ qua chúng. Không có cơ hội bác sĩ sẽ bỏ qua một khối u giai đoạn tiến triển. Họ không cần xử lý hình ảnh cho điều đó.
Về mặt thủ tục y tế, nếu một khối u không thể hoạt động được trước lần sàng lọc tiếp theo, sẽ không có sự khác biệt lớn giữa việc loại bỏ một khối u ở giai đoạn đầu hoặc một khối u có thêm một chút thời gian để phát triển. Số lượng mô bị loại bỏ nhiều hơn, nhưng loại hoạt động thường giống nhau. (Điều này giả định rằng bệnh nhân kiểm tra sức khỏe thường xuyên.)
Một dương tính giả có nhiều hàm ý không liên quan trực tiếp đến bệnh tật:
Đánh giá rủi ro-lợi ích này cho thấy rằng âm tính giả bao gồm ít rủi ro hơn cho bệnh nhân so với dương tính giả. Do đó, ưu tiên giảm dương tính giả thường cao hơn.
Thời gian của bác sĩ là quý giá
Từ trong lĩnh vực y học, các bác sĩ lâm sàng thường có rất nhiều loại bệnh để cố gắng phát hiện và chẩn đoán, và đây là một quá trình tốn thời gian. Một công cụ trình bày dương tính giả (ngay cả khi ở mức thấp) sẽ ít hữu ích hơn vì không thể tin vào chẩn đoán đó, nghĩa là mỗi khi đưa ra chẩn đoán đó, nó cần phải được kiểm tra. Hãy nghĩ về nó giống như WebMD của phần mềm - mọi thứ đều là dấu hiệu của bệnh ung thư!
Một công cụ trình bày âm tính giả, nhưng luôn thể hiện tích cực thực sự, hữu ích hơn nhiều, vì bác sĩ lâm sàng không cần lãng phí thời gian kiểm tra hai lần hoặc đoán lần thứ hai chẩn đoán. Nếu nó đánh dấu ai đó bị bệnh với một chẩn đoán cụ thể, công việc đã hoàn thành. Nếu không, những người không được đánh dấu là bị bệnh sẽ nhận được các xét nghiệm bổ sung.
Tốt hơn là có một công cụ có thể xác định chính xác ngay cả một đặc điểm của bệnh, hơn là một công cụ có thể làm mờ đi nhiều đặc điểm.
Tỷ lệ dương tính giả (FPR) còn được gọi là tỷ lệ cảnh báo sai (FAR); Tỷ lệ dương tính giả lớn có thể tạo ra hiệu suất kém của Hệ thống phát hiện hình ảnh y tế. Kết quả dương tính giả là nơi bạn nhận được kết quả dương tính cho xét nghiệm, khi đó bạn sẽ nhận được kết quả âm tính. Ví dụ: Thử thai là dương tính, trong khi thực tế người đó không mang thai.
Trong tất cả khả năng, tất cả mọi người trong chủ đề này đã biết rằng đây là một vấn đề cốt lõi của phân tích Bayes. Hoàn toàn vì lợi ích của những người hành hương trong tương lai, những người có thể nghĩ về dương tính giả vì bằng cách nào đó chỉ là một vấn đề trong X quang, tôi hy vọng nhận xét này sẽ cung cấp một quan điểm chung hơn một chút.