Ví dụ về việc áp dụng sai định lý Bayes

Đây Math Overflow câu hỏi cộng đồng hỏi cho "ví dụ về lập luận xấu mà liên quan đến việc áp dụng các định lý toán học trong bối cảnh phi toán học" và tạo ra một danh sách hấp dẫn của toán học pathologically áp dụng.

Tôi đang tự hỏi về các ví dụ tương tự về việc sử dụng bệnh lý của suy luận Bayes. Có ai gặp phải các bài báo học thuật, bài viết blog lập dị sử dụng các phương pháp Bayes theo cách thức thô bỉ.

bayesian

— Chris Brent
nguồn

Vâng. Gần đây tôi đã được thuê làm tư vấn thống kê để xem xét kỹ lưỡng một bài báo cụ thể (ly khủng khiếp) mà các tác giả của họ đã làm cho bản thân trông thậm chí còn tệ hơn trong một lá thư gửi cho biên tập viên bằng định lý Bayes. Họ đã bắt đầu với một giá trị dự đoán tích cực tính toán sai từ bài báo của họ (PPV = 95% được cho là). Về cơ bản, họ đã bỏ qua một bức thư quan trọng về điều này bởi Ricci ^{₍₂₀₀₄₎} đã cố gắng (và thất bại) để cho họ biết họ nên tính toán như thế nào (ông đề xuất 82,3%). Sau đó, họ tìm thấy một cuốn sách giáo khoa sinh học ^{_{(Elston & Johnson, 1994)}} và trích dẫn sai. Chúng tôi đã mua cuốn sách và kiểm tra, nhưng nhìn lại, điều này không cần thiết như tôi nghi ngờ. Tải một mớ hỗn độn này (từ thư trả lời của Barsness et al. Cho biên tập viên):

$P = = \frac{P (S / D_{1})}{P (S / D_{1}) + P (S / D_{2})}$ $\rm P=\frac{P(S/D_1)}{P(S/D_1)+P(S/D_2)}$ $[p = 95/(95 + 1.6)]$ là 98,3 phần trăm. Sử dụng tính toán PPV thấp hơn đã nói ở trên là 82,3%, xác suất của một sự kiện thực sự là 98,1%.

Xem bất cứ điều gì ~~kỳ lạ~~ mạch lạc ở đây? Tôi chắc chắn không ...

Đây là định lý của Bayes khi Elston và Johnson ^{₍₁₉₉₄₎} áp dụng nó vào một ví dụ về di truyền bệnh Hemophilia:

$P (D_{1} | S) = = \frac{P (D_{1}) P (S | D_{1})}{P (D_{1}) P (S | D_{1}) + P (D_{2}) P (S | D_{2})}$ $\rm P(D_1|S)=\frac{P(D_1)P(S|D_1)}{P(D_1)P(S|D_1)+P(D_2)P(S|D_2)}$

Sự khác biệt nói lên chính họ, nhưng đây là một trích dẫn từ cuộc thảo luận của họ về ví dụ:

Việc cô có một đứa con trai không bị ảnh hưởng làm giảm khả năng cô được thừa hưởng gen bệnh Hemophilia, và do đó xác suất đứa con trai thứ hai của cô sẽ bị ảnh hưởng.

Trường hợp Barsness và đồng nghiệp có ý tưởng rằng tỷ lệ lưu hành thấp củng cố PPV, tôi không biết, nhưng họ chắc chắn không chú ý đến sách giáo khoa của riêng họ.
$p_{1} = = 95 / (95 + 1.6) = = 98.3 \to p_{2} = = 98.3 / (98.3 + 1.6) = = 98,4 \to Giáo dục$ $p_1 = 95/(95 + 1.6)=98.3\rightarrow p_2 = 98.3/(98.3 + 1.6)=98.4\rightarrow\dots$ $\lim_{k\rightarrow\infty} p_k(p_{k-1},1.6)$
Khi sử dụng thông tin phổ biến của họ và một số ước tính hợp lý về độ nhạy và độ đặc hiệu từ các nghiên cứu khác về chủ đề này, PPV hóa ra thấp hơn nhiều (có thể thấp tới 3%). Điều buồn cười là tôi thậm chí đã không nghĩ sẽ sử dụng định lý của Bayes nếu họ không thử sử dụng nó để củng cố trường hợp của họ. Rõ ràng là sẽ không diễn ra theo cách đó với tỷ lệ phổ biến là 1,6%.

^{Tài liệu tham khảo

· Barsness, KA, Cha, ES, Bensard, DD, Calkins, CM, Partrick, DA, Karrer, FM, & Strain, JD (2003). Giá trị tiên đoán tích cực của gãy xương sườn như là một chỉ số về chấn thương không do tai nạn ở trẻ em. Tạp chí Chấn thương - Chấn thương, Nhiễm trùng và Chăm sóc quan trọng, 54 (6), 1107 Tiết1110.

· Elston, RC, & Johnson, WD (1994). Yếu tố cần thiết của thống kê sinh học (tái bản lần 2). Philadelphia: Công ty FA Davis.

· Ricci, LR (2004). Thư cho biên tập. Tạp chí Chấn thương - Chấn thương, Nhiễm trùng và Chăm sóc quan trọng, 56 (3), 721.}

— Nick Stauner
nguồn