Sự khác biệt giữa chức năng quyết định, dự đoán và chức năng dự đoán cho vấn đề hồi quy logistic là gì?


10

Tôi đã xem qua tài liệu sklearn nhưng tôi không thể hiểu mục đích của các chức năng này trong bối cảnh hồi quy logistic. Đối với decision_functionnó nói rằng đó là khoảng cách giữa siêu phẳng và thể hiện thử nghiệm. Thông tin cụ thể này hữu ích như thế nào? và làm thế nào điều này liên quan đến predictpredict-probaphương pháp?

Câu trả lời:


27

Hãy nhớ rằng hình thức chức năng của hồi quy logistic là

f(x)= =11+e-(β0+β1x1++βkxk)

Đây là những gì được trả lại bởi predict_proba.

Thuật ngữ bên trong số mũ

d(x)= =β0+β1x1++βkxk

là những gì được trả lại bởi decision_function. "Siêu phẳng" được đề cập trong tài liệu này là

β0+β1x1++βkxk= =0

Thuật ngữ này là một sự tiếp quản từ các máy vectơ hỗ trợ, theo nghĩa đen ước tính một siêu phẳng tách biệt. Đối với hồi quy logistic, siêu phẳng này là một chút của cấu trúc nhân tạo, nó là mặt phẳng có xác suất bằng nhau, trong đó mô hình đã xác định cả hai lớp mục tiêu đều có khả năng như nhau.

Các predicthàm trả về một quyết định lớp bằng cách sử dụng quy tắc

f(x)>0,5

Có nguy cơ hộp xà phòng, predictchức năng này có rất ít sử dụng hợp pháp và tôi xem việc sử dụng nó như là một dấu hiệu lỗi khi xem xét công việc của người khác. Tôi sẽ đi đủ xa để gọi nó là lỗi thiết kế trong chính sklearn ( predict_probahàm nên được gọi predictpredictnên được gọi predict_class, nếu có bất cứ điều gì).


Cảm ơn câu trả lời @Matthew, nhưng bạn có thể làm rõ điểm này hơn một chút "Đối với hồi quy logistic, siêu phẳng này là một cấu trúc nhân tạo, nó là mặt phẳng có xác suất bằng nhau, trong đó mô hình đã xác định cả hai lớp mục tiêu đều có khả năng như nhau . " ?
Tương tự

Giải thích này là thú vị và hữu ích. Tôi muốn sklearn giải thích nó tốt hơn. Điều tôi không hiểu là việc sử dụng để biết giá trị của x trong hàm logistic 1 / (1 + e ^ -x) là gì? Tất cả những gì tôi có thể nghĩ là có thể sử dụng một hàm sigmoid khác như x / (1+ | x |). Có nhiều hơn không? cảm ơn!
ldmtwo

Về cơ bản, hàm quyết định nên là sigmoid trong hồi quy logistic. Chính xác?
3nomis

2
Tôi nghĩ lý do khiến @Matthew có mặt trên hộp xà phòng là vì sử dụng 0,5 làm ngưỡng dự đoán là ngây thơ. Điều đầu tiên bạn nên làm là học cách sử dụng xác thực chéo, các đường cong ROC và AUC để chọn ngưỡng c thích hợp và sử dụng làm hàm quyết định f (x)> c.
ngày
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.