Đối với ma trận chi phí
L=[010.50]c1c2predictionc1c2truth
mất dự đoán lớp khi sự thật là lớp c 2 là L 12 = 0,5 và chi phí dự đoán lớp c 2 khi sự thật là lớp c 1 là L 21 = 1 . Không có chi phí cho dự đoán chính xác, L 11 = L 22 = 0 . Rủi ro có điều kiện R để dự đoán một trong hai lớp k làc1c2L12=0.5c2c1L21=1L11=L22=0Rk
Để tham khảo xem cácghi chútrên trang 15.
R(c1|x)R(c2|x)=L11Pr(c1|x)+L12Pr(c2|x)=L12Pr(c2|x)=L22Pr(c2|x)+L21Pr(c1|x)=L21Pr(c1|x)
Để giảm thiểu rủi ro / mất mát, bạn dự đoán nếu chi phí từ sai lầm đó xảy ra (đó là mất dự đoán sai lần xác suất hậu nghiệm rằng dự đoán sai L 12 Pr ( c 2 | x ) ) nhỏ hơn hơn chi phí dự đoán saic1L12Pr(c2|x)
nơi dòng thứ hai sử dụng quy tắc BayesPr(c2|x)αPr(x|c2)pr(c2). Cho xác suất trước bằng nhauPr(c1)=Pr(c2)=0,5bạn nhận được
1
L12Pr(c2|x)L12Pr(x|c2)Pr(c2)L12Pr(c2)L21Pr(c1)<L21Pr(c1|x)<L21Pr(x|c1)Pr(c1)<Pr(x|c1)Pr(x|c2)
Pr(c2|x)∝Pr(x|c2)Pr(c2)Pr(c1)=Pr(c2)=0.512<Pr(x|c1)Pr(x|c2)
vì vậy bạn chọn phân loại quan sát vì là tỷ lệ khả năng vượt quá ngưỡng này. Bây giờ tôi không rõ liệu bạn có muốn biết "ngưỡng tốt nhất" về tỷ lệ khả năng hay về mặt thuộc tính x . Câu trả lời thay đổi theo hàm chi phí. Sử dụng Gaussian trong sự bất bình đẳng với σ 1 = σ 2 = σ và μ 1 = 0 , L 2 = 1 ,
1c1xσ1=σ2=σμ1=0μ2=1
vì vậychỉ có thể đạt đượcngưỡng dự đoán theoxkhi bạn tìm kiếm nếu tổn thất từ dự đoán sai là như nhau, tức làL12=L21vì chỉ khi đó bạn mới có thểđăng nhập(L12
12log(12)log(12)xσ2x<12π√σexp[−12σ2(x−μ1)2]12π√σexp[−12σ2(x−μ2)2]<log(12π−−√σ)−12σ2(x−0)2−[log(12π−−√σ)−12σ2(x−1)2]<−x22σ2+x22σ2−2x2σ2+12σ2<12σ2−log(12)<12−log(12)σ2
xL12=L21và bạn nhận được
x0<1log(L12L21)=log(1)=0 .
x0<12