Ý nghĩa trực quan gần nhất của điểm số F1 đang được coi là giá trị trung bình của thu hồi và độ chính xác. Hãy xóa nó cho bạn:
Trong một nhiệm vụ phân loại, bạn có thể dự định xây dựng một bộ phân loại với độ chính xác VÀ thu hồi cao. Ví dụ, một bộ phân loại cho biết một người có trung thực hay không.
Để chính xác, bạn có thể thường nói chính xác có bao nhiêu người trung thực ngoài kia trong một nhóm nhất định. Trong trường hợp này, khi quan tâm đến độ chính xác cao, bạn cho rằng bạn có thể phân loại sai một người nói dối là trung thực nhưng không thường xuyên. Nói cách khác, ở đây bạn đang cố gắng xác định người nói dối từ trung thực như một nhóm.
Tuy nhiên, để nhớ lại, bạn sẽ thực sự lo lắng nếu bạn nghĩ một người nói dối phải trung thực. Đối với bạn, đây sẽ là một mất mát lớn và một sai lầm lớn và bạn không muốn làm lại. Ngoài ra, không sao nếu bạn phân loại ai đó trung thực là kẻ nói dối nhưng người mẫu của bạn không bao giờ (hoặc chủ yếu là không) yêu cầu người nói dối là trung thực. Nói cách khác, ở đây bạn đang tập trung vào một lớp cụ thể và bạn đang cố gắng không phạm sai lầm về nó.
Bây giờ, hãy xem trường hợp bạn muốn mô hình của mình (1) xác định chính xác trung thực từ một kẻ nói dối (độ chính xác) (2) xác định mỗi người từ cả hai lớp (nhớ lại). Điều đó có nghĩa là bạn sẽ chọn mô hình sẽ hoạt động tốt trên cả hai số liệu.
Sau đó, bạn quyết định lựa chọn mô hình sẽ cố gắng đánh giá từng mô hình dựa trên giá trị trung bình của hai số liệu. Điểm số F là điểm tốt nhất có thể mô tả điều này. Chúng ta hãy xem công thức:
Nhớ lại: p = tp / (tp + fp)
Nhớ lại: r = tp / (tp + fn)
Điểm F: fscore = 2 / (1 / r + 1 / p)
Như bạn thấy, độ thu hồi VÀ độ chính xác càng cao thì điểm F càng cao.