Để hiệu chỉnh mức độ tin cậy đến xác suất trong học tập có giám sát (nói để ánh xạ độ tin cậy từ SVM hoặc cây quyết định sử dụng dữ liệu được phủ ngoài), một phương pháp là sử dụng Thang đo của Platt (ví dụ: Lấy Xác suất được hiệu chuẩn từ Tăng tốc ).
Về cơ bản, người ta sử dụng hồi quy logistic để ánh xạ thành . Biến phụ thuộc là nhãn thực và yếu tố dự đoán là độ tin cậy từ mô hình không được hiệu chỉnh. Điều tôi không hiểu là việc sử dụng biến mục tiêu khác 1 hoặc 0. Phương thức này yêu cầu tạo một "nhãn" mới:
Để tránh quá mức cho tập tàu sigmoid, một mô hình ngoài mẫu được sử dụng. Nếu có ví dụ dương và ví dụ âm trong tập huấn luyện, đối với mỗi ví dụ đào tạo, Platt sử dụng các giá trị đích và (thay vì 1 và 0, tương ứng), trong đó
Điều tôi không hiểu là mục tiêu mới này hữu ích như thế nào. Không phải hồi quy logistic đơn giản sẽ coi biến phụ thuộc là nhãn nhị phân (bất kể nhãn nào được đưa ra)?
CẬP NHẬT:
Tôi thấy rằng trong SAS thay đổi sự phụ thuộc từ sang một thứ khác được hoàn nguyên về cùng một mô hình (sử dụng ). Có lẽ lỗi của tôi hoặc có lẽ là thiếu tính linh hoạt của SAS. Tôi đã có thể thay đổi mô hình trong R. Ví dụ:PROC GENMOD
data(ToothGrowth)
attach(ToothGrowth)
# 1/0 coding
dep <- ifelse(supp == "VC", 1, 0)
OneZeroModel <- glm(dep~len, family=binomial)
OneZeroModel
predict(OneZeroModel)
# Platt coding
dep2 <- ifelse(supp == "VC", 31/32, 1/32)
plattCodeModel <- glm(dep2~len, family=binomial)
plattCodeModel
predict(plattCodeModel)
compare <- cbind(predict(OneZeroModel), predict(plattCodeModel))
plot(predict(OneZeroModel), predict(plattCodeModel))