Tôi sẽ giải thích những điều này theo một số cách khác nhau vì nó giúp tôi hiểu nó.
Hãy lấy một ví dụ cụ thể. Bạn đang làm một xét nghiệm cho một bệnh trên một nhóm người. Bây giờ hãy xác định một số thuật ngữ. Đối với mỗi điều sau đây, tôi đề cập đến một cá nhân đã được thử nghiệm:
Đúng dương tính (TP) : Có bệnh, được xác định là có bệnh
Dương tính giả (FP) : Không có bệnh, được xác định là có bệnh
Âm tính thật (TN) : Không có bệnh, được xác định là không mắc bệnh
Âm tính giả (FN) : Có bệnh, được xác định là không mắc bệnh
Trực quan, điều này thường được hiển thị bằng cách sử dụng ma trận nhầm lẫn :
Các tỷ lệ dương tính giả (FPR) là số lượng người đã không có bệnh nhưng được xác định là có bệnh (tất cả fps), chia cho tổng số người không có bệnh (bao gồm tất cả FPS và TNS) .
FPR = FPFP+ TN
Các tỷ lệ phát hiện sai (FDR) là số lượng người đã không có bệnh nhưng được xác định là có bệnh (tất cả fps), chia cho tổng số lượng người đã được xác định là mắc bệnh lao phổi (bao gồm tất cả FPS và TPS ).
FD R = FPFP+ TP
Vì vậy, sự khác biệt là ở mẫu số tức là bạn đang so sánh số lượng dương tính giả với cái gì?
Các FPR là nói cho bạn tỷ lệ tất cả những người không có bệnh người sẽ được xác định là mắc bệnh lao phổi.
Các FDR là nói cho bạn tỷ lệ tất cả những người được xác định là có bệnh người không có bệnh.
Cả hai đều hữu ích, các biện pháp khác nhau của sự thất bại. Tùy thuộc vào tình hình và tỷ lệ của TP, FP, TN và FN, bạn có thể quan tâm nhiều hơn về cái kia.
Bây giờ chúng ta hãy đặt một số con số này. Bạn đã đo được 100 người cho căn bệnh này và bạn nhận được những điều sau đây:
Tích cực thực sự (TPs) : 12
Dương tính giả (FP) : 4
Tiêu cực thực sự (TNs) : 76
Âm tính giả (FN) : 8
Để hiển thị điều này bằng cách sử dụng ma trận nhầm lẫn:
Sau đó,
FPR = FPFP+ TN= 44 + 76= 480= 0,05 = 5 %
FD R = FPFP+ TP= 44 + 12= 416= 0,25 = 25 %
Nói cách khác,
FPR cho bạn biết rằng 5% số người không mắc bệnh được xác định mắc bệnh. FDR cho bạn biết rằng 25% những người được xác định mắc bệnh thực sự không mắc bệnh.
EDIT dựa trên nhận xét của @ amoeba (cũng là các số trong ví dụ trên):
n
[Lưu ý bên lề: Wikipedia chỉ ra rằng mặc dù FPR tương đương về mặt toán học với tỷ lệ lỗi loại I, nó được coi là khác biệt về mặt khái niệm bởi vì người ta thường đặt một ưu tiên trong khi cái kia thường được sử dụng để đo hiệu suất của một bài kiểm tra sau đó. Điều này rất quan trọng nhưng tôi sẽ không thảo luận về vấn đề này ở đây].
Và để hoàn thiện hơn một chút:
Rõ ràng, FPR và FDR không phải là số liệu liên quan duy nhất bạn có thể tính toán với bốn đại lượng trong ma trận nhầm lẫn. Trong số nhiều số liệu có thể hữu ích trong các bối cảnh khác nhau , hai số liệu tương đối phổ biến mà bạn có thể gặp phải là:
Tỷ lệ dương tính thật (TPR) , còn được gọi là độ nhạy , là tỷ lệ của những người mắc bệnh được xác định mắc bệnh.
TPR = TPTP+ FN
Tỷ lệ âm tính thật (TNR) , còn được gọi là độ đặc hiệu , là tỷ lệ của những người không mắc bệnh được xác định là không mắc bệnh.
TNR = TNTN+ FP