Một quy tắc trong khâu dứt điểm là một phương tiện để đánh giá dự đoán của một đại lý của các xác suất liên quan đến một sự kiện phân loại, cho một (phân loại) kết quả của sự kiện này. Tùy thuộc vào dự đoán và kết quả quan sát được, quy tắc tính điểm sẽ cho tác nhân một điểm số (một con số thực). Một quy tắc tính điểm được cho là để gán điểm sao cho trung bình, tác nhân có ít điểm nhất sẽ đưa ra dự đoán chính xác nhất. (Các quy ước khác nhau về việc liệu các quy tắc tính điểm có được đóng khung về mặt tối thiểu hóa hoặc tối đa hóa hay không. Ở đây tôi đang xem chế độ thu nhỏ.)
Một tính chất quan trọng của quy tắc tính điểm là liệu chúng có phải là quy tắc chấm điểm thích hợp hay không; nghĩa là, cho dù họ cho điểm trung bình ít nhất khi một tác nhân đoán xác suất thực sự (hoặc, trong một khung Bayes chủ quan, họ cho điểm trung bình thấp nhất, được đưa ra cho các linh mục của chính đại lý, khi một đại lý sử dụng mức độ niềm tin của chính mình phỏng đoán của nó). Trong trường hợp có sự kiện nhị phân, lỗi bình phương từ 0 hoặc 1 (điểm Brier) là quy tắc tính điểm thích hợp trong khi lỗi tuyệt đối thì không. Tại sao? Vâng, tiêu chí của sự phù hợp dựa trên giá trị trung bình và giá trị trung bình là thước đo của xu hướng trung tâm giúp giảm thiểu tổng các khác biệt bình phương, nhưng không cần giảm thiểu sai số tuyệt đối.
Dòng suy nghĩ này cho thấy rằng nếu chúng ta thay thế trung bình trong định nghĩa của quy tắc chấm điểm thích hợp bằng một số chức năng thống kê khác, chẳng hạn như trung bình, thì chúng ta sẽ có được một loại quy tắc chấm điểm phù hợp tương tự. Không phải là không có lý khi tưởng tượng một tình huống mà một đặc vụ muốn giảm thiểu điểm trung vị của nó hơn là điểm trung bình của nó. Trên thực tế, có vẻ như không có quy tắc tính điểm trung bình không phù hợp. Xem xét lại trường hợp của một sự kiện nhị phân, nếu xác suất thực nhỏ hơn 1/2, thì điểm trung bình của một tác nhân sẽ bằng với bất kỳ điểm nào được trao cho tác nhân khi sự kiện không xảy ra, bất kể sự kiện đó là gì xác suất chính xác. Các shenanigans tương tự dường như xảy ra nếu chúng ta thay thế trung bình bằng, giả sử, trung bình hình học.
Vì vậy, có một ý nghĩa rằng để lý thuyết về các quy tắc chấm điểm thích hợp hoạt động như dự định, chức năng thống kê phải là trung bình?
Tôi nhận ra đây là một câu hỏi mơ hồ và câu trả lời tốt nhất có thể là một lời giải thích tại sao câu hỏi không thực sự có ý nghĩa, vì vậy đây là bối cảnh mà tôi thấy mình hỏi nó, để giúp bạn không nhầm lẫn. Tôi là một nhà tâm lý học về việc ra quyết định và tôi thường thấy mình muốn định lượng hiệu suất (có thể là hiệu suất dự đoán, dưới sự xác nhận chéo hoặc mô hình phù hợp với hậu kỳ) của một mô hình đưa ra xác suất về những gì mọi người sẽ chọn một kịch bản quyết định nhị phân. Các cuộc thảo luận ở trên cho thấy tôi nên sử dụng một quy tắc chấm điểm thích hợp. Khó chịu, quy tắc chấm điểm thích hợp không cùng quy mô với xác suất. Ví dụ, tôi thấy mình muốn lấy căn bậc hai của lỗi bình phương trung bình thay vì chỉ nhìn vào lỗi bình phương trung bình (nghĩa là điểm Brier trung bình), nhưng trong trường hợp của một thử nghiệm, RMSE tương đương với lỗi tuyệt đối, không đúng, vì vậy tôi sẽ không nghĩ rằng các mô hình kém chính xác hơn sẽ tốt hơn? Rõ ràng tôi không thể thay đổi phương pháp đánh giá các quy tắc tính điểm của mình từ một phương tiện về phương tiện sang một phương diện, ví dụ: trung bình. Tôi phải đơn giản làm quen với thang đo của một trong những quy tắc chấm điểm thích hợp thông thường hoặc sử dụng thống kê phát hiện tín hiệu như khu vực dưới đường cong ROC hoặc d '?
Một điều phức tạp nữa là trong một nghiên cứu, tôi đang xem xét mô hình khởi động tham số phù hợp, theo Wagenmakers, Ratcliff, Gomez và Iverson (2004), có nghĩa là tôi đang xem xét các biểu đồ mật độ của điểm số thay vì điểm số riêng lẻ. Sau đó, thậm chí còn chưa rõ liệu tôi có nên quan tâm đến tính đúng đắn hay về một số tiêu chí tương tự.
Chỉnh sửa: xem chủ đề bình luận này trên Reddit để thảo luận thêm.
Wagenmakers, E.-J., Ratcliff, R., Gomez, P., & Iverson, GJ (2004). Đánh giá mô hình bắt chước bằng cách sử dụng bootstrap tham số. Tạp chí Tâm lý học toán học, 48 , 28 bù50. doi: 10.1016 / j.jmp.2003.11.004