Học có giám sát với dữ liệu không chắc chắn?


11

Có một phương pháp hiện có để áp dụng mô hình học tập có giám sát vào một bộ dữ liệu không chắc chắn? Ví dụ: giả sử chúng tôi có bộ dữ liệu với các lớp A và B:

+----------+----------+-------+-----------+
| FeatureA | FeatureB | Label | Certainty |
+----------+----------+-------+-----------+
|        2 |        3 | A     | 50%       |
|        3 |        1 | B     | 80%       |
|        1 |        1 | A     | 100%      |
+----------+----------+-------+-----------+

Làm thế nào chúng ta có thể đào tạo một mô hình học máy về điều này? Cảm ơn.

Câu trả lời:


11

Là một chất lượng số mà bạn gán cho dữ liệu của mình, tôi nghĩ rằng "sự chắc chắn" này chắc chắn có thể được sử dụng như một trọng số. Điểm "chắc chắn" cao hơn làm tăng trọng số mà dữ liệu có trên hàm quyết định, điều này có ý nghĩa.

Nhiều thuật toán học có giám sát hỗ trợ trọng số, vì vậy bạn chỉ cần tìm một phiên bản có trọng số của phiên bản bạn định sử dụng.


2
(+1) Và vì về cơ bản các trọng sẽ có xu hướng hoạt động như "lặp lại" của các điểm, có lẽ bất kỳ thuật toán có thể được kludged vào một phiên bản trọng như vậy, ví dụ như trong ví dụ OP, vượt qua trong [5,8,10] bản 3 điểm, phản ánh sự chắc chắn của họ là [50,80,100]%. (Điều này không bao giờ thực sự cần thiết, vì nếu nó có thể được thực hiện trên nguyên tắc, cần có một phiên bản trọng số tương ứng của thuật toán.)
GeoMatt22

5

1A0B0.6AAB01

đăng nhậpp(Một|x)p(B|x)= =đăng nhậpp(Một|x)1-P(Một|x)β0+β1Txp(Một|x)Mộtβ0+β1Tx>0B


Vì vậy, nếu bạn có một vấn đề phân loại nhiều lớp, bạn có thể đặt mục tiêu của mình thành các vectơ có độ dài bằng với số lượng lớp không?
hyperdo

Số lớp -1, giả sử tổng số xác nhận là 100%; ví dụ tương tự như hồi quy logistic. Rất nhiều phân loại tạo ra điểm số (ví dụ: ước tính của p (lớp | dữ liệu) theo một số mô hình). Tất cả câu trả lời này đề xuất là thay vì dự đoán trực tiếp các lớp, hãy xem các chắc chắn là điểm số và thay vào đó là dự đoán chúng. Sau đó, làm một cái gì đó với điểm số.
dơi
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.