Giả sử mô hình của bạn thực sự dự đoán A có 40% cơ hội và B có 60% cơ hội. Trong một số trường hợp, bạn có thể muốn chuyển đổi điều này thành một phân loại mà B sẽ xảy ra (vì nó có nhiều khả năng hơn A). Sau khi được chuyển đổi thành phân loại, mọi dự đoán đều đúng hoặc sai, và có một số cách thú vị để kiểm đếm những câu trả lời đúng và sai. Một là độ chính xác thẳng (tỷ lệ phần trăm của câu trả lời đúng). Những người khác bao gồm độ chính xác và thu hồi hoặc F-đo . Như những người khác đã đề cập, bạn có thể muốn nhìn vào đường cong ROC . Hơn nữa, bối cảnh của bạn có thể cung cấp một ma trận chi phí cụ thể nhằm thưởng cho các mặt tích cực thực sự khác với các tiêu cực thực sự và / hoặc xử phạt các dương tính giả khác với các phủ định sai.
Tuy nhiên, tôi không nghĩ đó là những gì bạn đang thực sự tìm kiếm. Nếu bạn nói B có 60% cơ hội xảy ra và tôi nói nó có 99% cơ hội xảy ra, chúng tôi có những dự đoán rất khác nhau mặc dù cả hai sẽ được ánh xạ tới B trong một hệ thống phân loại đơn giản. Nếu A xảy ra thay vào đó, bạn chỉ là loại sai trong khi tôi rất sai, vì vậy tôi hy vọng rằng tôi sẽ nhận được một hình phạt cứng hơn bạn. Khi mô hình của bạn thực sự tạo ra xác suất, quy tắc tính điểm là thước đo hiệu suất của các dự đoán xác suất của bạn. Cụ thể bạn có thể muốn một quy tắc chấm điểm thích hợp , có nghĩa là điểm số được tối ưu hóa cho kết quả được hiệu chỉnh tốt.
B S= 1NΣt = 1N( ft- ot)2
ftot
Tất nhiên loại quy tắc tính điểm bạn chọn có thể phụ thuộc vào loại sự kiện bạn đang cố gắng dự đoán. Tuy nhiên, điều này sẽ cung cấp cho bạn một số ý tưởng để nghiên cứu thêm.
Tôi sẽ thêm một lời cảnh báo rằng bất kể bạn làm gì, khi đánh giá mô hình của bạn theo cách này, tôi khuyên bạn nên xem số liệu của mình trên dữ liệu ngoài mẫu (nghĩa là dữ liệu không được sử dụng để xây dựng mô hình của bạn). Điều này có thể được thực hiện thông qua xác nhận chéo . Có lẽ đơn giản hơn là bạn có thể xây dựng mô hình của mình trên một tập dữ liệu và sau đó đánh giá nó trên một tập dữ liệu khác (cẩn thận không để suy luận từ sự cố tràn ra khỏi mẫu vào mô hình trong mẫu).