Các giá trị chính xác cho độ chính xác và thu hồi khi mẫu số bằng 0 là gì?


15

Độ chính xác được định nghĩa là:

p = dương tính thật / (dương tính thật + dương tính giả)

Giá trị của độ chính xác là gì nếu (dương tính thật + dương tính giả) = 0? Có phải nó không được xác định?

Câu hỏi tương tự để nhớ lại:

r = dương tính thật / (dương tính thật + âm tính giả)

Trong trường hợp này, giá trị của việc thu hồi là gì nếu (dương tính thật + âm tính giả) = 0?

PS Câu hỏi này rất giống với câu hỏi Giá trị chính xác cho độ chính xác và thu hồi trong các trường hợp cạnh là gì? .


1
Heh, nó thậm chí còn được trả lời trong bản sao; nhưng hãy gọi nó là một bản sao tốt.

Câu trả lời:


9

Các câu trả lời cho câu hỏi liên kết trước đó cũng áp dụng ở đây.

Nếu (dương tính thật + âm tính giả) = 0 thì không có trường hợp dương nào trong dữ liệu đầu vào, vì vậy mọi phân tích về trường hợp này đều không có thông tin và vì vậy không có kết luận nào về cách xử lý các trường hợp tích cực. Bạn muốn N / A hoặc một cái gì đó tương tự như kết quả tỷ lệ, tránh lỗi chia cho 0

Nếu (dương tính thật + dương tính giả) = 0 thì tất cả các trường hợp đã được dự đoán là âm: đây là một đầu của đường cong ROC. Một lần nữa, bạn muốn nhận ra và báo cáo khả năng này trong khi tránh phân chia theo lỗi không .


Cảm ơn Henry cho câu trả lời. Nếu tôi hiểu chính xác, trong trường hợp trước, bạn không muốn nhận ra và báo cáo kết quả, trong khi đó trong trường hợp sau bạn làm . Đúng không?
Raffi Khatchadourian

Có: Trong trường hợp không có đầu vào tích cực, độ chính xác là vô nghĩa; trong trường hợp không dự đoán tích cực, bạn muốn báo cáo rằng thử nghiệm đã được đặt thành cực kỳ âm tính.
Henry

5

Một câu trả lời thú vị được cung cấp tại đây: https://github.com/dice-group/gerbil/wiki/Precision,-Recall-and-F1-measure

Các tác giả của đầu ra của module điểm khác nhau cho độ chính xác và thu hồi tùy thuộc vào việc tích cực thực sự, dương tính giả và âm tính giả là tất cả 0. Nếu có, kết quả là bề ngoài là một trong những tốt.

Trong một số trường hợp hiếm hoi, việc tính toán Độ chính xác hoặc Thu hồi có thể gây ra chia cho 0. Về độ chính xác, điều này có thể xảy ra nếu không có kết quả nào trong câu trả lời của chú thích và do đó, kết quả dương tính cũng như sai là 0 Đối với những trường hợp đặc biệt này, chúng tôi đã xác định rằng nếu dương tính thật, dương tính giả và âm tính giả đều bằng 0, thì độ chính xác, thu hồi và số đo F1 là 1. Điều này có thể xảy ra trong trường hợp tiêu chuẩn vàng chứa tài liệu mà không có chú thích và chú thích (chính xác) trả về không có chú thích. Nếu dương thực sự là 0 và một trong hai bộ đếm khác lớn hơn 0, độ chính xác, thu hồi và số đo F1 là 0.

Tôi không chắc loại điểm này có hữu ích trong các tình huống khác ngoài trường hợp đặc biệt của họ không, nhưng nó đáng để suy nghĩ.


1

Khi đánh giá bộ phân loại ở ngưỡng cao, độ chính xác có thể (thường là thực tế) không phải là 1 khi thu hồi bằng 0. Nó thường là Không áp dụng! Tôi nghĩ có điều gì đó không đúng về cách mọi người vẽ đường cong P / R. Tránh các mẫu N / A là sai lệch theo nghĩa bạn tránh các mẫu đơn lẻ. Tôi đã tính toán độ chính xác trung bình cho thu hồi trung bình bỏ qua các mẫu N / A và tôi chưa bao giờ có một bộ phân loại bắt đầu từ 1 cho 0 cho một mạng lưới thần kinh nông trong phát hiện đối tượng. Điều này cũng đúng với các đường cong được tính toán với các số tp, fp, fn. Thật dễ dàng để xác minh bằng giấy và bút chì với một hình ảnh duy nhất. Ví dụ: Tôi có một trình phân loại xuất ra cho một hình ảnh duy nhất: pre = =.. 1 1 0 0], fn = [0 1 1 1 2 2], fp = [3 3 2 1 1 0]. thu hồi rec = [1 .5 .5 .5 0 0] và độ chính xác = [. 4 .25 1/3 .5 0 NaN]. Tôi không thấy việc thay thế NaN hoặc độ chính xác (@ rec == 0) bằng 1. 1 nên là giới hạn trên, không phải là giá trị chúng tôi thay thế độ chính xác (@ rec == 0) bằng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.