Giải thích Định lý Bayes áp dụng cho kết quả chụp nhũ ảnh dương tính


11

Tôi đang cố gắng quấn đầu xung quanh kết quả của Định lý Bayes áp dụng cho ví dụ chụp X-quang cổ điển, với độ xoắn của hình chụp nhũ ảnh là hoàn hảo.

Đó là,

Tỷ lệ mắc ung thư:.01

Xác suất chụp X quang tuyến vú dương tính, cho bệnh nhân bị ung thư:1

Xác suất chụp X quang tuyến vú dương tính, cho bệnh nhân không bị ung thư:.01

Bằng Bayes:

P (ung thư | nhũ ảnh +) =1.01(1.01)+(.091.99)

=.5025

Vì vậy, nếu một người ngẫu nhiên trong dân số chụp X quang tuyến vú và thu được kết quả dương tính, có khả năng 50% họ bị ung thư? Tôi không thể hiểu được bằng trực giác làm thế nào 1% cơ hội nhỏ của dương tính giả trong 1% dân số có thể kích hoạt kết quả 50%. Về mặt logic, tôi sẽ nghĩ rằng chụp X-quang dương tính hoàn toàn đúng với tỷ lệ dương tính giả nhỏ sẽ chính xác hơn nhiều.


2
Tỷ lệ dương tính giả không nằm trên 1% mà là 99% dân số. Đó là lý do tại sao bạn có một xác suất có vẻ thấp, bởi vì xác suất trước đó rất cao là ai đó khỏe mạnh. Cũng nên nhớ rằng đây chỉ là một thử nghiệm duy nhất, điều gì xảy ra nếu bạn thực hiện thử nghiệm nhiều lần? Sau đó, độ chính xác của bài kiểm tra bắt đầu quan trọng hơn.
DSaxton

Nếu đó là một hình chụp nhũ ảnh hoàn hảo, thì tỷ lệ dương tính giả sẽ bằng 0 và sau đó p (C | M) = 1 * 0,01 / (1 * 0,01 + 0 * 0,99) = 1,0 Khi tỷ lệ dương tính giả của phương pháp chụp quang tuyến vú sự hoàn hảo (0) sau đó thuật ngữ thứ hai ở phía dưới tiến đến không. Tỷ lệ dương tính giả 'nhỏ' kết hợp với tỷ lệ cơ sở nhỏ tương tự để tạo ra kết quả trái ngược.
Dave X

fwiw kinh nghiệm của tôi cho thấy rằng logic, thuộc loại suy diễn chính thức, là một điều tuyệt vời nhưng tạo ra những trực giác cực kỳ xấu về suy luận xác suất. Các công cụ ở đây bmj.com/content 4323 / bmj.d6386 có thể giúp trực giác của bạn.
liên hợp chiến

Theo hiểu biết của tôi, câu hỏi là hỏi trực giác về cách xác suất có điều kiện có thể rất thấp với các giả định; không phải về thống kê chụp nhũ ảnh thực tế thực tế (mà các câu trả lời dường như là về).
Juho Kokkala

Tôi có một lỗi đánh máy trong mẫu số (thuật ngữ thứ 2 phải là (.01 * 0.99)? Kết quả là chính xác. Không thực sự là một trực giác nhưng đơn giản hóa bạn có P (C | +) = P (C) / (P (C) + (P (+ |! C) P (! C)) và P (C) rất thấp. Vì vậy, P (C | +) cực kỳ nhạy cảm với P (+ |! C), tức là bạn cần P ( + |! C) << P (C) để đưa P (C | +) tiếp cận 1
David Waterworth

Câu trả lời:


11

Tôi sẽ trả lời câu hỏi này từ quan điểm y tế và thống kê. Nó đã nhận được rất nhiều sự chú ý trên báo chí, đặc biệt là sau cuốn sách bán chạy nhất The Signal and the noise của Nate Silver, cũng như một số bài báo trong các ấn phẩm như Thời báo New York giải thích về khái niệm này. Vì vậy, tôi rất vui vì @ user2666425 đã mở chủ đề này trên CV.

Trước hết, hãy để tôi làm rõ rằng là không chính xác. Tôi có thể nói với bạn rằng con số này sẽ là một giấc mơ trở thành sự thật. Thật không may, có rất nhiều hình ảnh chụp quang tuyến vú âm tính giả , đặc biệt là ở những phụ nữ có mô vú dày đặc. Con số ước tính có thể là hoặc cao hơn , tùy thuộc vào việc bạn gộp tất cả các loại ung thư vú khác nhau thành một (xâm lấn v DCIS) và các yếu tố khác. Đây là lý do tại sao các phương thức khác dựa trên công nghệ siêu âm hoặc MRI cũng được áp dụng. Sự khác biệt giữa và là rất quan trọng trong xét nghiệm sàng lọc.20 % 0,8 1p(+|C)=120%0.81

Định lý Bayes cho chúng ta biết rằng và gần đây đã nhận được rất nhiều sự chú ý vì nó liên quan chụp nhũ ảnh ở phụ nữ trẻ, nguy cơ thấp . Tôi nhận ra đây không phải là chính xác những gì bạn đang hỏi, mà tôi đề cập đến trong đoạn cuối, nhưng nó là chủ đề được tranh luận nhiều nhất. Đây là một hương vị của các vấn đề:p(C|+)=p(+|C)p(+)p(C)

  1. Tỷ lệ trước (hoặc xác suất mắc ung thư dựa trên tỷ lệ lưu hành) ở bệnh nhân trẻ tuổi , nói từ 40 - 50 tuổi là khá nhỏ. Theo NCI, nó có thể làm tròn nó ở (xem bảng bên dưới). Xác suất tiền xét nghiệm tương đối thấp này tự nó làm giảm xác suất có điều kiện sau ung thư sau khi xét nghiệm cho thấy rằng chụp quang tuyến vú là dương tính, bất kể khả năng hoặc dữ liệu được thu thập.1.5%

  2. Xác suất dương tính giả trở thành một vấn đề rất quan trọng trong quy trình sàng lọc sẽ được áp dụng cho hàng ngàn và hàng ngàn phụ nữ khỏe mạnh tiên nghiệm. Vì vậy, mặc dù tỷ lệ dương tính giả là (cao hơn nhiều nếu bạn tập trung vào rủi ro tích lũy ) nghe có vẻ không tệ lắm, nhưng thực sự đó là một vấn đề về chi phí tâm lý và kinh tế khổng lồ, đặc biệt là trước mức thấp xác suất thử nghiệm ở những bệnh nhân trẻ tuổi, nguy cơ thấp. Con số được đánh giá cao - thực tế là "sự sợ hãi" là cực kỳ phổ biến do nhiều yếu tố, bao gồm cả những lo ngại về dược phẩm.1 %710%1%

Vì vậy, tính toán lại và rất quan trọng, đối với phụ nữ trẻ không có yếu tố rủi ro :

p(C|+)=p(+|C)p(+)p(C)=

=p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)p(C)=0.80.80.015+0.070.9850.015=0.148 .

Khả năng bị ung thư khi chụp X quang tuyến vú được đọc là dương tính có thể thấp tới ở phụ nữ trẻ, có nguy cơ thấp. Bên cạnh đó, việc đọc nhũ ảnh đi kèm với ước tính gián tiếp về độ tin cậy trong chẩn đoán mà bác sĩ X quang đã có (nó được gọi là BI-RADS), và phân tích Bayes này sẽ thay đổi hoàn toàn khi chúng ta chuyển từ BI-RADS 3 sang BI-RADS 5 - tất cả các bài kiểm tra "tích cực" theo nghĩa rộng nhất.15%

Con số này có thể được thay đổi một cách hợp lý tùy thuộc vào ước tính bạn xem xét trong tính toán của bạn, nhưng sự thật là các khuyến nghị cho độ tuổi bắt đầu tham gia chương trình chụp nhũ ảnh gần đây đã được đẩy lên từ đến4045 .

Ở phụ nữ lớn tuổi, tỷ lệ lưu hành (và do đó xác suất trước xét nghiệm) tăng tuyến tính theo tuổi. Theo báo cáo hiện tại, nguy cơ người phụ nữ sẽ được chẩn đoán mắc bệnh ung thư vú trong 10 năm tới , bắt đầu ở các độ tuổi sau, như sau:

Age 30 . . . . . . 0.44 percent (or 1 in 227)
Age 40 . . . . . . 1.47 percent (or 1 in 68)
Age 50 . . . . . . 2.38 percent (or 1 in 42)
Age 60 . . . . . . 3.56 percent (or 1 in 28)
Age 70 . . . . . . 3.82 percent (or 1 in 26)

Điều này dẫn đến rủi ro tích lũy trọn đời khoảng :10%

Tính toán ở phụ nữ lớn tuổi với tỷ lệ mắc sẽ là:4%

p(C|+)=0.80.80.04+0.070.960.04=0.3232% thấp hơn bạn đã tính.

Tôi không thể nhấn mạnh đến việc có bao nhiêu "sự sợ hãi" ngay cả trong các dân số cũ. Là một thủ tục sàng lọc, chụp X-quang tuyến vú đơn giản là bước đầu tiên nên có ý nghĩa đối với việc chụp X-quang dương tính về cơ bản được giải thích vì có khả năng bệnh nhân bị ung thư vú, đảm bảo làm việc thêm bằng siêu âm, xét nghiệm nhũ ảnh bổ sung (chẩn đoán), chụp quang tuyến vú, MRI hoặc sinh thiết. Nếu rất cao, chúng tôi sẽ không xử lý xét nghiệm sàng lọc thì đó sẽ là xét nghiệm chẩn đoán , chẳng hạn như sinh thiết.p(C|+)

Câu trả lời cụ thể cho câu hỏi của bạn:

Đó là "sự sợ hãi", là chứ không phải như trong OP, kết hợp với tỷ lệ mắc bệnh tương đối thấp (xác suất trước xét nghiệm thấp hoặc cao ) đặc biệt ở phụ nữ trẻ, chiếm tỷ lệ xác suất sau kiểm tra thấp hơn ở các lứa tuổi. p(+|C¯)710%1%p(C¯)Lưu ý rằng "tỷ lệ báo động sai" này được nhân với tỷ lệ lớn hơn nhiều trường hợp không mắc bệnh ung thư (so với bệnh nhân mắc bệnh ung thư) trong mẫu số, chứ không phải là "1% khả năng nhỏ của dương tính giả trong 1% dân số" bạn đề cập đến. Tôi tin rằng đây là câu trả lời cho câu hỏi của bạn. Để nhấn mạnh, mặc dù điều này sẽ không được chấp nhận trong xét nghiệm chẩn đoán, nhưng nó vẫn có giá trị trong một quy trình sàng lọc.

Vấn đề trực giác: @Juho Kokkala đưa ra vấn đề mà OP đang hỏi về trực giác . Tôi nghĩ rằng nó được ngụ ý trong các tính toán và đoạn kết thúc, nhưng đủ công bằng ... Đây là cách tôi sẽ giải thích nó với một người bạn ... Hãy giả vờ rằng chúng ta sẽ săn lùng các mảnh thiên thạch bằng máy dò kim loại ở Winslow, Arizona. Ngay ở đây:

Hình ảnh từ metsengcrater.com

... Và máy dò kim loại tắt. Chà, nếu bạn nói rằng rất có thể đó là từ một đồng xu mà một khách du lịch bỏ đi, có lẽ bạn đã đúng. Nhưng bạn có ý chính: nếu nơi đó chưa được sàng lọc kỹ lưỡng, nhiều khả năng tiếng bíp từ máy dò trên một nơi như thế này xuất phát từ một mảnh thiên thạch so với khi chúng ta ở trên đường phố NYC.

Những gì chúng ta đang làm với chụp nhũ ảnh sẽ đến một dân số khỏe mạnh, tìm kiếm một căn bệnh thầm lặng mà nếu không được phát hiện sớm có thể gây tử vong. May mắn thay, tỷ lệ lưu hành (mặc dù rất cao so với các bệnh ung thư ít chữa khác) đủ thấp để xác suất ngẫu nhiên gặp phải ung thư là thấp, ngay cả khi kết quả là "dương tính" , và đặc biệt là ở phụ nữ trẻ.

Mặt khác, nếu không có dương tính giả, nghĩa là ( ,p(C¯|+)=0

p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)p(C)=p(+|C)p(+|C)p(C)p(C)=1 , nhiều như xác suất về việc đã va phải một mảnh thiên thạch nếu máy dò kim loại của chúng tôi phát nổ sẽ độc lập với khu vực chúng tôi đang khám phá nếu thay vì máy dò kim loại thông thường, chúng tôi đang sử dụng một công cụ hoàn toàn chính xác để phát hiện axit amin ngoài vũ trụ trong thiên thạch đoạn (ví dụ trang điểm). Nó vẫn có khả năng tìm thấy một mảnh vỡ trên sa mạc Arizona hơn là ở thành phố New York, nhưng nếu máy dò phát ra tiếng bíp, chúng ta sẽ biết rằng chúng ta đã tìm thấy một thiên thạch.100%

Vì chúng tôi không bao giờ có thiết bị hoặc hệ thống đo chính xác hoàn toàn, phân số sẽ , và càng không hoàn hảo, nó càng ít phần của , hoặc trước đó , sẽ được "truyền lại" cho LHS của phương trình là hậu phương . Nếu chúng ta giải quyết một loại máy dò cụ thể, phân số khả năng sẽ đóng vai trò là hằng số trong phương trình tuyến tính có dạng, , trong đó <1p(C)sau=α*trướcsau<trướclikelihoodunconditional p(+)=p(+|C)p(+|C)p(C)+p(+|C¯)p(C¯)<1p(C)posterior=αpriorposterior<priorvà càng nhỏ trước, càng nhỏ tuyến tính sẽ càng về sau. Điều này được gọi là sự phụ thuộc vào mức độ phổ biến của giá trị tiên đoán dương tính (PPV) : xác suất các đối tượng có xét nghiệm sàng lọc dương tính thực sự mắc bệnh.


5

Một vấn đề quan trọng với chụp nhũ ảnh chưa được giải quyết thỏa đáng trong bài diễn văn là định nghĩa sai về "dương tính". Điều này được mô tả trong chương Chẩn đoán trong http://biostat.mc.vanderbilt.edu/ClinStat - xem liên kết về Thống kê sinh học trong nghiên cứu y sinh tại đó.

Một trong những hệ thống mã hóa chẩn đoán được sử dụng rộng rãi nhất trong chụp nhũ ảnh là điểm BI-RADS và điểm 4 là kết quả "dương tính" thường xuyên. Định nghĩa của loại 4 là "Không phải là đặc điểm của ung thư vú, nhưng xác suất hợp lý là ác tính (3 đến 94%); nên xem xét sinh thiết." Với phạm vi rủi ro kéo dài từ 0,03 đến 0,94 cho một loại , nghĩa là, sự không đồng nhất đáng kinh ngạc trong ý nghĩa "tích cực" thực sự có nghĩa là gì, không có gì lạ khi chúng ta có một mớ hỗn độn trên tay.

Đó cũng là một dấu hiệu của suy nghĩ không rõ ràng rằng hệ thống BI-RADS không có danh mục cho người có rủi ro ước tính là 0,945.

Vì Nate Silver rất lập luận một cách hùng hồn trong Tín hiệu và Tiếng ồn , nếu chúng ta nghĩ theo xác suất, chúng ta sẽ đưa ra quyết định tốt hơn xung quanh. Loại bỏ các thuật ngữ như "dương tính" và "âm tính" cho các xét nghiệm y tế sẽ loại bỏ các kết quả dương tính giả và âm tính giả và truyền đạt sự không chắc chắn (và biện minh cho nhiều xét nghiệm hơn trước khi chẩn đoán) một cách tối ưu.


Chúng tôi đã viết đồng bộ thực tế - kiểm tra nhận xét của tôi bên dưới về BI-RADS. Tôi không thể đồng ý nhiều hơn (hàng tấn kinh nghiệm cá nhân về điều này với tư cách là một bác sĩ X quang).
Antoni Parellada

3

Có một cuộc thảo luận thú vị về điều này trong cuốn sách Rủi ro được tính toán

Phần lớn cuốn sách nói về việc tìm ra những cách nói rõ ràng hơn và suy nghĩ về xác suất và rủi ro. Một ví dụ:

Xác suất một phụ nữ ở độ tuổi 40 bị ung thư vú là khoảng 1%. Nếu cô ấy bị ung thư vú, xác suất cô ấy sẽ xét nghiệm dương tính trên chụp X quang tuyến vú là khoảng 90 phần trăm. Nếu cô ấy không bị ung thư vú, xác suất cô ấy vẫn sẽ kiểm tra dương tính là 9%. Cơ hội mà một người phụ nữ kiểm tra dương tính thực sự bị ung thư vú là gì?

Đây là cách cuốn sách trình bày giải pháp, sử dụng 'tần số tự nhiên'. Hãy xem xét 10.000 phụ nữ, 1% bị ung thư vì vậy đó là 100 phụ nữ. Trong số này, 90% sẽ trả lại các xét nghiệm dương tính (tức là 90 phụ nữ bị ung thư sẽ kiểm tra dương tính). Trong số 9900 người không bị ung thư, 9% sẽ trả về kết quả xét nghiệm dương tính hoặc 891 phụ nữ. Vì vậy, có 891 + 90 = 981 phụ nữ có xét nghiệm dương tính trong đó 90 người bị ung thư. Vì vậy, khả năng người phụ nữ có kết quả xét nghiệm dương tính bị ung thư là 90/981 = 0,092

Nếu 100% phụ nữ có kết quả xét nghiệm ung thư dương tính mà chỉ cần thay đổi số một chút thành 100 / (100 + 891) = 0,1

Phương pháp tiếp cận tần số tự nhiên để hiểu tích cực sai


1

Có lẽ dòng suy nghĩ này là chính xác?:

Đối với bất kỳ người ngẫu nhiên nào, có 1% khả năng họ bị ung thư, và do đó, có khả năng rằng hình ảnh chụp quang tuyến vú của một người ngẫu nhiên sẽ dương tính. Nếu họ không bị ung thư, có 1% khả năng hình ảnh chụp quang tuyến vú sẽ dương tính..011

Vì vậy, nó là trực giác gần với một đồng xu lật cho một người ngẫu nhiên. Tôi không chắc làm thế nào để giải thích thêm ủng hộ bệnh ung thư khi chụp X quang tuyến vú dương tính.0.0025


1

Đây là một cách đơn giản nhưng trực quan để xem xét nó. Cân nhắc 100 người. Một người bị ung thư và sẽ xét nghiệm dương tính. Trong số 99 người không, một trong số họ sẽ có kết quả xét nghiệm dương tính giả. Vì vậy, trong hai điều tích cực, một người sẽ bị ung thư và một người sẽ không.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.