Bạn có thể muốn kiểm tra tài liệu tham khảo này . Sci-kit tìm hiểu thực hiện hồi quy logistic ngẫu nhiên và phương pháp được mô tả ở đó.
Nhưng để trả lời câu hỏi của bạn, hai phương pháp khác nhau chủ yếu trong mục tiêu của họ. Hồi quy logistic là về việc phù hợp với một mô hình và RLR là về việc tìm các biến đi vào mô hình.
Hồi quy logistic Vanilla là một mô hình tuyến tính tổng quát. Đối với phản hồi nhị phân, chúng tôi cho rằng tỷ lệ cược log của xác suất phản hồi là hàm tuyến tính của một số dự đoán. Các hệ số của các yếu tố dự đoán được ước tính bằng khả năng tối đa và suy luận về các tham số sau đó dựa trên các thuộc tính mẫu lớn của mô hình. Để có kết quả tốt nhất, chúng tôi thường cho rằng mô hình khá đơn giản và được hiểu rõ. Chúng tôi biết những gì các biến độc lập tác động đến phản ứng. Chúng tôi muốn ước tính các tham số của mô hình.
Tất nhiên, trong thực tế, chúng ta không phải lúc nào cũng biết những biến nào nên được đưa vào mô hình. Điều này đặc biệt đúng trong các tình huống học máy trong đó số lượng các biến giải thích tiềm năng là rất lớn và giá trị của chúng rất ít.
Trong những năm qua, nhiều người đã cố gắng sử dụng các kỹ thuật phù hợp với mô hình thống kê cho mục đích lựa chọn biến (đọc "tính năng"). Trong mức độ tin cậy ngày càng tăng:
- Phù hợp với một mô hình lớn và thả các biến với số liệu thống kê Wald không đáng kể. Không phải lúc nào cũng tạo ra mô hình tốt nhất.
- Nhìn vào tất cả các mô hình có thể và chọn "tốt nhất". Tính toán chuyên sâu và không mạnh mẽ.
- Phù hợp với mô hình lớn với thời hạn hình phạt L1 (phong cách lasso). Biến vô dụng được thả trong phù hợp. Tốt hơn, nhưng không ổn định với ma trận thưa thớt.
- Phương pháp ngẫu nhiên 3. Lấy các tập con ngẫu nhiên, ghép một mô hình bị phạt cho từng mô hình và đối chiếu kết quả. Các biến xuất hiện thường xuyên được chọn. Khi phản hồi là nhị phân, đây là hồi quy logistic ngẫu nhiên. Một kỹ thuật tương tự có thể được kéo với dữ liệu liên tục và mô hình tuyến tính nói chung.