Nó phụ thuộc vào loại lỗi bạn muốn xác định.
Dữ liệu đào tạo và áp dụng sự khác biệt dữ liệu
Một kỹ thuật được sử dụng để ước tính các lỗi trên các dự đoán là huấn luyện một số thuật toán sử dụng các hạt ngẫu nhiên khác nhau. Đối với hầu hết các thuật toán, điều này sẽ dẫn đến các dự đoán khác nhau: biến thể có thể cho bạn ước tính.
Phân loại cụ thể
Vì vậy, để xác định lỗi phân loại, có khoảng hai phương pháp:
event by event :
Bạn có thể chỉ cần nhìn vào các dự đoán, tạo (ví dụ) thùng và chia nhãn 1 cho nhãn 0. Bởi vì có 100 sự kiện của nhãn 1 với dự đoán trong khoảng 0,6-0,65 và 50 với nhãn 0 với dự đoán trong cùng một phạm vi chỉ đơn giản mang lại 2/3 cơ hội cho một sự kiện thuộc lớp 1. Hay nói cách khác, với thay đổi 1/3, các sự kiện của bạn trong thùng đó không phải là lớp 1.
Tổng hiệu quả :
Cách tiếp cận này là cách sử dụng nếu phù hợp với trường hợp của bạn, nó cụ thể hơn. Trước tiên, bạn xác định nơi bạn áp dụng cắt giảm của mình (có nghĩa là: ngưỡng nào cho các dự đoán cho một sự kiện là loại 1 hoặc 0; đây thường không phải là 0,5 mà là một bằng khen được tối ưu hóa). Giả sử bạn cắt giảm 0,9 (vì vậy <0,9 -> lớp 0, lớp khác 1). Sau đó, bạn có thể đếm:
- có bao nhiêu sự kiện lớp 1 bị mất (thấp hơn 0,9)?
- Có bao nhiêu sự kiện lớp 0 vẫn còn trong mẫu?
Điều này cung cấp cho bạn một ước tính về lỗi trên đầu ra phân loại của bạn.
Hồi quy cụ thể
gắn thẻ và thăm dò :
Bạn có thể sử dụng các giá trị đã biết, nhập chúng và nhận lỗi của chúng. Sau đó, bạn có thể giả sử rằng các giá trị ở giữa hai trong số đó, gần như có lỗi trung bình. Hay nói cách khác, bạn ngoại suy lỗi từ các giá trị đã biết.
Trung bình đơn giản : Đơn giản chỉ cần lấy trung bình của các lỗi. Nếu chúng được phân phối gần như bằng nhau, đây là một cách tốt để đi.