Trước hết hãy để tôi nói rằng tôi đã có một khóa học thống kê ở trường kỹ thuật 38 năm trước. Vì vậy, tôi đang bay mù ở đây.
Tôi đã có kết quả về cơ bản 18 xét nghiệm chẩn đoán riêng biệt cho một bệnh. Mỗi thử nghiệm là nhị phân - có / không, không có ngưỡng nào có thể được điều chỉnh để "điều chỉnh" thử nghiệm. Đối với mỗi thử nghiệm, tôi có dữ liệu hợp lệ về mặt tích cực / âm tính khi so sánh với "tiêu chuẩn vàng", mang lại độ đặc hiệu và số nhạy cảm (và bất cứ điều gì khác bạn có thể rút ra từ dữ liệu đó).
Tất nhiên, không có xét nghiệm đơn lẻ nào có đủ độ đặc hiệu / độ nhạy được sử dụng một mình và khi bạn "nhãn cầu", kết quả của tất cả các xét nghiệm thường không có xu hướng rõ ràng.
Tôi đang tự hỏi đâu là cách tốt nhất để kết hợp những con số này theo cách sẽ mang lại điểm số cuối cùng (hy vọng) đáng tin cậy hơn bất kỳ bài kiểm tra nào. Cho đến nay tôi đã nghĩ ra kỹ thuật kết hợp các đặc tính của các bài kiểm tra TRUE bằng cách sử dụng
spec_combined = 1 - (1 - spec_1) * (1 - spec_2) * ... (1 - spec_N)
và kết hợp độ nhạy của các bài kiểm tra FALSE theo cùng một cách. Tỉ lệ
(1 - sens_combined) / (1 - spec_combined)
sau đó dường như mang lại một "điểm số cuối cùng" khá tốt, với giá trị trên 10 hoặc hơn là TRUE đáng tin cậy và giá trị dưới 0,1 hoặc hơn là một FALSE đáng tin cậy.
Nhưng sơ đồ này không có bất kỳ sự nghiêm ngặt thực sự nào và đối với một số kết hợp thử nghiệm, nó dường như tạo ra một câu trả lời phản trực giác.
Có cách nào tốt hơn để kết hợp các kết quả thử nghiệm của nhiều xét nghiệm, dựa trên tính đặc hiệu và độ nhạy của chúng không? (Một số xét nghiệm có độ đặc hiệu 85 và độ nhạy là 15, các xét nghiệm khác thì ngược lại.)
OK, đầu tôi đau!
Giả sử tôi đã kiểm tra 1-4 với độ nhạy / độ đặc hiệu (tính theo%):
- 65/50
- 25/70
- 30/60
- 85/130
Các xét nghiệm 1 và 2 đều dương tính, 3 và 4 âm tính.
Xác suất giả định rằng 1 là dương tính giả sẽ là (1 - 0,5) và với 2 (1 - 0,7), do đó xác suất cả hai đều dương tính giả sẽ là 0,5 x 0,3 = 0,15.
Xác suất giả định rằng 3 và 4 là âm tính giả sẽ là (1 - 0,3) và (1 - 0,85) hoặc 0,7 x 0,15 = 0,105.
(Chúng ta sẽ bỏ qua hiện tại thực tế là các con số không cộng lại.)
Nhưng xác suất giả định rằng 1 và 2 là dương thực sự là 0,65 và 0,25 = 0,1625, trong khi xác suất giả định rằng 3 và 4 là âm tính thực là 0,6 và 0,35 = 0,21.
Bây giờ chúng ta có thể hỏi hai câu hỏi:
- Tại sao không các con số tăng lên (hoặc thậm chí đến gần). (Số giác / thông số kỹ thuật tôi sử dụng là từ "đời thực".)
- Làm thế nào tôi nên quyết định giả thuyết nào (rất có thể) đúng (trong ví dụ này có vẻ là "tiêu cực" cho cả hai calcs, nhưng tôi không chắc đó luôn là trường hợp) và tôi có thể sử dụng cái gì cho "công đức "Để quyết định xem kết quả có" đáng kể "không?
Thêm thông tin
Đây là một nỗ lực để tinh chỉnh và mở rộng một sơ đồ "trọng số" hiện có hoàn toàn "nghệ thuật" trong tự nhiên (nghĩa là chỉ cần rút ra khỏi ** của ai đó). Lược đồ hiện tại về cơ bản nằm trên dòng "Nếu bất kỳ hai trong số ba đầu tiên là dương, và nếu hai trong bốn tiếp theo và một trong hai tiếp theo, thì giả sử là dương". (Tất nhiên, đó là một ví dụ đơn giản hóa.) Các số liệu thống kê có sẵn không hỗ trợ sơ đồ trọng số đó - ngay cả với thuật toán trọng số thô dựa trên các số liệu thống kê tôi đưa ra với các câu trả lời khác nhau đáng kể. Nhưng, vắng mặt một cách nghiêm ngặt để đánh giá các số liệu thống kê tôi không có uy tín.
Ngoài ra, lược đồ hiện tại chỉ quyết định tích cực / tiêu cực và tôi cần tạo ra một trường hợp "mơ hồ" (có giá trị thống kê) ở giữa, vì vậy cần có một số bằng khen.
Muộn nhất
Tôi đã thực hiện một thuật toán suy luận Bayes "thuần túy" ít nhiều, và sau khi đi vòng quanh một số vấn đề phụ, nó dường như hoạt động khá tốt. Thay vì làm việc từ các đặc tính và độ nhạy, tôi lấy các công thức đầu vào trực tiếp từ các số dương / sai dương thực sự. Thật không may, điều này có nghĩa là tôi không thể sử dụng một số dữ liệu chất lượng tốt hơn không được trình bày theo cách cho phép các số này được trích xuất, nhưng thuật toán sạch hơn nhiều, cho phép sửa đổi các đầu vào với tính toán tay ít hơn nhiều, và nó có vẻ khá ổn định và kết quả phù hợp với "trực giác" khá tốt.
Tôi cũng đã đưa ra một "thuật toán" (theo nghĩa lập trình thuần túy) để xử lý các tương tác giữa các quan sát phụ thuộc lẫn nhau. Về cơ bản, thay vì tìm kiếm một công thức quét, thay vào đó tôi giữ cho mỗi lần quan sát một hệ số nhân xác suất cận biên được sửa đổi khi các quan sát trước đó được xử lý, dựa trên một bảng đơn giản - "Nếu quan sát A là đúng thì hãy sửa đổi xác suất cận biên của B bằng a hệ số 1,2 ", vd. Không thanh lịch, bằng mọi cách, nhưng có thể phục vụ được, và nó dường như ổn định một cách hợp lý trên một loạt các đầu vào.
(Tôi sẽ thưởng tiền thưởng cho những gì tôi cho là bài viết hữu ích nhất trong vài giờ, vì vậy nếu bất cứ ai muốn nhận được một vài lượt thích, hãy xem nó.)