Ngưỡng quyết định tạo ra sự đánh đổi giữa số lượng tích cực mà bạn dự đoán và số lượng tiêu cực mà bạn dự đoán - bởi vì, về mặt phương pháp, việc tăng ngưỡng quyết định sẽ làm giảm số lượng tích cực mà bạn dự đoán và tăng số lượng tiêu cực bạn dự đoán.
Ngưỡng quyết định không phải là một siêu tham số theo nghĩa điều chỉnh mô hình vì nó không thay đổi tính linh hoạt của mô hình.
C(ví dụ: các hệ số hồi quy logistic sẽ khác nhau), trong khi điều chỉnh ngưỡng chỉ có thể thực hiện hai điều: đánh đổi TP cho FN và FP cho TN. Tuy nhiên, mô hình vẫn giữ nguyên, vì điều này không thay đổi các hệ số. (Điều tương tự cũng đúng với các mô hình không có hệ số, chẳng hạn như rừng ngẫu nhiên: thay đổi ngưỡng không thay đổi bất cứ điều gì về cây.) Vì vậy, theo nghĩa hẹp, bạn đã đúng khi tìm ra sự đánh đổi tốt nhất giữa các lỗi là "điều chỉnh", nhưng bạn đã sai khi nghĩ rằng việc thay đổi ngưỡng được liên kết với các tham số siêu mô hình khác theo cách được tối ưu hóa theo GridSearchCV
.
Nói cách khác, thay đổi ngưỡng quyết định phản ánh sự lựa chọn của bạn về số lượng sai tích cực và phủ định sai mà bạn muốn có. Hãy xem xét giả thuyết rằng bạn đặt ngưỡng quyết định thành một giá trị hoàn toàn hợp lý như -1. Tất cả các xác suất đều không âm, vì vậy với ngưỡng này, bạn sẽ dự đoán "dương" cho mọi quan sát. Từ một góc độ nhất định, điều này là tuyệt vời, bởi vì tỷ lệ âm tính giả của bạn là 0,0. Tuy nhiên, tỷ lệ dương tính giả của bạn cũng ở mức cực cao là 1.0, vì vậy theo nghĩa đó, sự lựa chọn ngưỡng của bạn ở -1 là rất tệ.
Tất nhiên, lý tưởng là có TPR là 1.0 và FPR là 0,0 và FNR là 0,0. Nhưng điều này thường là không thể trong các ứng dụng trong thế giới thực, vì vậy câu hỏi sau đó trở thành "tôi sẵn sàng chấp nhận bao nhiêu FPR cho bao nhiêu TPR?" Và đây là động lực của đường cong roc .