Có một vài quy tắc chấm điểm thích hợp và đúng đắn cho dữ liệu đếm bạn có thể sử dụng. Quy tắc chấm điểm là các hình phạt giới thiệu với P là phân phối dự đoán và y là giá trị quan sát được. Chúng có một số tính chất mong muốn, trước hết và quan trọng nhất là dự báo gần với xác suất thực sẽ luôn nhận được ít hình phạt hơn và có một dự báo tốt nhất (duy nhất) và đó là khi xác suất dự đoán trùng với xác suất thực. Do đó, giảm thiểu kỳ vọng của s ( y , P ) có nghĩa là báo cáo xác suất thực. Xem thêm Wikipedia .s(y,P)Pys(y,P)
Thông thường người ta lấy trung bình của những người trên tất cả các giá trị dự đoán là
S=1n∑ni=1s(y(i),P(i))
Quy tắc nào cần thực hiện tùy thuộc vào mục tiêu của bạn, nhưng tôi sẽ đưa ra một đặc điểm sơ bộ khi mỗi quy tắc được sử dụng tốt.
f(y)Pr(Y=y)F(y)∑k0,1,…,∞Iμσ
Quy tắc chấm điểm đúng
- Điểm Brier : (ổn định cho sự mất cân bằng kích thước trong các dự đoán phân loại)s(y,P)=−2f(y)+∑kf2(k)
- Điểm Dawid-Sebastiani : (tốt cho lựa chọn mô hình dự đoán chung; ổn định cho sự mất cân bằng kích thước trong các dự báo phân loại)s(y,P)=(y−μσ)2+2logσ
- Điểm sai lệch : ( là thuật ngữ chuẩn hóa chỉ phụ thuộc vào , trong các mô hình Poisson, nó thường được sử dụng làm độ lệch bão hòa, sử dụng tốt cho các ước tính từ một khung ML)s(y,P)=−2logf(y)+gygyy
- Điểm số logarit : (rất dễ tính; ổn định cho sự mất cân bằng kích thước trong các yếu tố dự đoán phân loại)s(y,P)=−logf(y)
- Điểm xác suất được xếp hạng : (tốt cho việc đối chiếu các dự đoán khác nhau về số lượng rất cao; dễ bị mất cân bằng kích thước trong các dự đoán phân loại)s(y,P)=∑k{F(k)−I(y≤k)}2
- Điểm hình cầu : (ổn định cho sự mất cân bằng kích thước trong các dự đoán phân loại)s(y,P)=f(y)∑kf2(k)√
Các quy tắc tính điểm khác (không phù hợp nhưng thường được sử dụng)
- Điểm lỗi tuyệt đối :(không thích hợp)s(y,P)=|y−μ|
- Điểm sai số bình phương : (không đúng nghiêm ngặt; dễ bị ngoại lệ; dễ bị mất cân bằng kích thước trong các yếu tố dự báo phân loại)s(y,P)=(y−μ)2
- Pearson bình thường điểm số bình phương lỗi : (không đúng cách; dễ bị ngoại lệ; có thể được sử dụng để kiểm tra nếu kiểm tra mô hình nếu điểm trung bình rất khác với 1, ổn định cho sự mất cân bằng kích thước trong các yếu tố dự đoán phân loại)s(y,P)=(y−μσ)2
Mã R ví dụ cho các quy tắc đúng đắn nghiêm ngặt:
library(vcdExtra)
m1 <- glm(Freq ~ mental, family=poisson, data=Mental)
# scores for the first observation
mu <- predict(m1, type="response")[1]
x <- Mental$Freq[1]
# logarithmic (equivalent to deviance score up to a constant)
-log(dpois(x, lambda=mu))
# quadratic (brier)
-2*dpois(x,lambda=mu) + sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) })
# spherical
- dpois(x,mu) / sqrt(sapply(mu, function(x){ sum(dpois(1:1000,lambda=x)^2) }))
# ranked probability score
sum(ppois((-1):(x-1), mu)^2) + sum((ppois(x:10000,mu)-1)^2)
# Dawid Sebastiani
(x-mu)^2/mu + log(mu)