Tôi đang học một khóa học máy và các bài giảng chứa thông tin những gì tôi thấy mâu thuẫn với cuốn sách được đề xuất.
Vấn đề là như sau: có ba phân loại:
- phân loại A cung cấp hiệu suất tốt hơn trong phạm vi ngưỡng thấp hơn,
- phân loại B cung cấp hiệu suất tốt hơn trong phạm vi ngưỡng cao hơn,
- phân loại C những gì chúng ta nhận được bằng cách lật một đồng xu và chọn từ hai phân loại.
Hiệu suất của phân loại C, như được xem trên đường cong ROC là gì?
Bài giảng trình bày rằng chỉ bằng cách lật đồng tiền này, chúng ta sẽ có được " vỏ lồi " kỳ diệu của đường cong ROC của A và B.
Tôi không hiểu điểm này. Chỉ bằng cách lật một đồng xu, làm thế nào chúng ta có thể có được thông tin?
Bài giảng
Cuốn sách nói gì
Cuốn sách được đề xuất ( Khai thác dữ liệu ... của Ian H. Witten, Eibe Frank và Mark A. Hall ) mặt khác nói rằng:
Để thấy điều này, hãy chọn một mức cắt xác suất cụ thể cho phương pháp A mang lại tỷ lệ dương đúng và sai tương ứng của tA và fA, và một mức cắt khác cho phương pháp B cung cấp tB và fB. Nếu bạn sử dụng hai sơ đồ này một cách ngẫu nhiên với xác suất p và q, trong đó p + q = 1, thì bạn sẽ nhận được tỷ lệ dương đúng và sai của p. tA + q. tB và p. fA + q. fB. Điều này thể hiện một điểm nằm trên đường thẳng nối các điểm (tA, fA) và (tB, fB), và bằng cách thay đổi p và q, bạn có thể tìm ra toàn bộ đường thẳng giữa hai điểm này.
Theo hiểu biết của tôi, những gì cuốn sách nói là để thực sự có được thông tin và tiếp cận thân tàu lồi, chúng ta cần phải làm một cái gì đó cao cấp hơn là chỉ đơn giản là lật một đồng xu.
AFAIK, cách chính xác (như được đề xuất bởi cuốn sách) là như sau:
- chúng ta nên tìm một ngưỡng tối ưu Oa cho phân loại A
- chúng ta nên tìm một ngưỡng tối ưu Ob cho phân loại B
định nghĩa C như sau:
- Nếu t <Oa, sử dụng phân loại A với t
- Nếu t> Ob, sử dụng phân loại B với t
- Nếu Oa <t <Ob, chọn giữa phân loại A với Oa và B với Ob theo xác suất là tổ hợp tuyến tính của nơi chúng ta nằm giữa Oa và Ob.
Điều này có đúng không? Nếu có, có một vài khác biệt chính so với những gì các slide gợi ý.
- Đây không phải là một loại tiền xu đơn giản, mà là một thuật toán tiên tiến hơn, cần các điểm và điểm được xác định thủ công dựa trên khu vực chúng ta rơi vào.
- Nó không bao giờ sử dụng phân loại A và B với các giá trị ngưỡng giữa Oa và Ob.
Bạn có thể giải thích cho tôi vấn đề này và cách hiểu chính xác về vấn đề này là gì , nếu cách hiểu của tôi không đúng?
Điều gì sẽ xảy ra nếu chúng ta chỉ đơn giản lật một đồng xu như các slide sẽ gợi ý? Tôi nghĩ rằng chúng ta sẽ có một đường cong ROC nằm giữa A và B, nhưng không bao giờ "tốt hơn" so với đường cong tốt hơn tại một điểm nhất định.
Theo như tôi có thể thấy, tôi thực sự không hiểu làm thế nào các slide có thể đúng. Tính toán xác suất ở phía bên tay trái không có ý nghĩa với tôi.
Cập nhật: Tìm thấy bài viết được viết bởi tác giả gốc, người đã phát minh ra phương pháp vỏ lồi: http://www.bmva.org/bmvc/1998/pdf/p082.pdf