Là f-đo đồng nghĩa với độ chính xác?


10

Tôi hiểu rằng f-đo (dựa trên độ chính xác và thu hồi) là ước tính mức độ chính xác của phân loại. Ngoài ra, f-đo được ưa chuộng hơn độ chính xác khi chúng ta có một bộ dữ liệu không cân bằng. Tôi có một câu hỏi đơn giản (đó là về việc sử dụng thuật ngữ chính xác hơn là về công nghệ). Tôi có một bộ dữ liệu không cân bằng và tôi sử dụng f-đo trong các thí nghiệm của mình. Tôi chuẩn bị viết một bài báo KHÔNG dành cho hội thảo khai thác dữ liệu / máy học. Do đó, tôi có thể tham khảo f-đo đồng nghĩa với độ chính xác trong ngữ cảnh này. Ví dụ: tôi có số đo f là 0,82, sau đó tôi có thể nói rằng trình phân loại của tôi đạt được dự đoán chính xác 82% không?


Sẽ tốt hơn nếu giới thiệu thước đo f nếu bạn sử dụng nó. Thay thế cả hai là không chính xác theo quan điểm của tôi. Trong trường hợp của bạn nếu độ chính xác của bạn là 99%, bạn sẽ đạt được 99% dự đoán chính xác, không quan trọng biện pháp f của bạn là gì và nó có thể khiến độc giả mắc lỗi.
AdrienNK

@AdrienNK: Độ chính xác 99% không ngụ ý dự đoán đúng 99% trừ khi tần số tương đối của các trường hợp thử nghiệm giống như trong tình huống ứng dụng thực.
cbeleites không hài lòng với SX

@cbeleites bạn nói đúng, tôi biết, nhưng thường thì các trường hợp thử nghiệm được phát hành từ cùng một bản phân phối (cũng có thể đó là quan điểm thiên vị mà tôi có về nó vì tôi hiếm khi phải làm việc với dữ liệu không phải là trường hợp đó)
AdrienNK

@AdrienNK: Tôi là nhà hóa học phân tích làm việc theo hướng chẩn đoán y khoa. Tỷ lệ mắc bệnh trong câu hỏi có thể khác nhau về thứ tự cường độ giữa các quần thể bệnh nhân khác nhau. Xem ví dụ như các cuộc thảo luận của PPVs khác nhau trong nửa cuối của bài viết này: nature.com/news/2011/110323/full/471428a.html
cbeleites không hài lòng với SX

2
Đó là một bài đọc hấp dẫn, cảm ơn bạn đã chú ý đến điều đó.
AdrienNK

Câu trả lời:


13

Trước hết, tôi thấy "chính xác" đôi khi hơi sai lệch, vì nó đề cập đến những điều khác biệt:

Thuật ngữ chính xác trong geneal để đánh giá các hệ thống hoặc phương pháp (tôi là nhà hóa học phân tích) đề cập đến sự thiên vị của các dự đoán, tức là nó trả lời cho câu hỏi dự đoán trung bình tốt như thế nào.

TP+TNmộttôitôi cmộtSeS

Điểm F thường được giới thiệu là trung bình hài hòa của độ chính xác và thu hồi (hoặc giá trị tiên đoán tích cực và độ nhạy). Đối với câu hỏi của bạn, tôi nghĩ sẽ hữu ích khi đánh vần thêm một chút và đơn giản hóa nó:

F= =2precTôiSTôionrecmộttôitôiprecTôiSTôion+recmộttôitôi= =2TPmộttôitôi PTPmộttôitôiTTPmộttôitôi P+TPmộttôitôiT= =2TP2mộttôitôi PmộttôitôiTTPmộttôitôi Tmộttôitôi PmộttôitôiT+TPmộttôitôi Pmộttôitôi PmộttôitôiT= =2 TP2TPmộttôitôi T+TPmộttôitôi P= =2 TPmộttôitôi T+mộttôitôi P

Biểu thức cuối cùng không phải là một phần của bất cứ điều gì mà tôi có thể nghĩ là một nhóm các trường hợp thử nghiệm nhất định. Cụ thể, một sự chồng chéo (nặng) giữa các trường hợp TRUE và POSITIVE được mong đợi. Điều này sẽ khiến tôi không thể hiện điểm F theo tỷ lệ phần trăm vì loại đó ngụ ý tỷ lệ các trường hợp. Trên thực tế, tôi nghĩ rằng tôi đã cảnh báo người đọc rằng điểm F không có cách giải thích như vậy.


F1

0

Câu trả lời nhanh:

Không, F-measurecông thức không bao gồm TNyếu tố và nó rất hữu ích trong việc truy xuất các vấn đề (doc) .

Do đó, đây là F-measurecách tiếp cận chính xác để đánh giá các bộ dữ liệu mất cân bằng hoặc trong trường hợp sự cố truy xuất thay vì accuracyROC.

Accuracy = (TP+TN) / (TP+FP+FN+TN)

F1_Score = 2*(Recall * Precision) / (Recall + Precision)
# or
F1_Score = 2*TP / (2*TP + FP + FN)

[ LƯU Ý ]:

Precision = TP / (TP+FP)

Recall = TP / (TP+FN)
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.