Đây là một câu hỏi liên quan đến một thực hành hoặc phương pháp theo sau bởi một số đồng nghiệp của tôi. Trong khi thực hiện mô hình hồi quy logistic, tôi đã thấy mọi người thay thế các biến phân loại (hoặc các biến liên tục được đánh dấu) bằng Trọng số bằng chứng tương ứng (WoE). Điều này được cho là được thực hiện để thiết lập một mối quan hệ đơn điệu giữa biến hồi quy và biến phụ thuộc. Bây giờ theo tôi hiểu, một khi mô hình được tạo ra, các biến trong phương trình KHÔNG phải là biến trong tập dữ liệu. Thay vào đó, các biến trong phương trình bây giờ là loại tầm quan trọng hoặc trọng số của các biến trong việc phân tách biến phụ thuộc !
Câu hỏi của tôi là: làm thế nào để chúng ta giải thích mô hình hoặc các hệ số mô hình? Ví dụ cho phương trình sau:
chúng ta có thể nói rằng là mức tăng tương đối trong tỷ lệ lẻ cho 1 đơn vị tăng trong biến x 1 .
Nhưng nếu biến được thay thế bằng WoE của nó, thì cách hiểu sẽ được thay đổi thành: tăng tương đối tỷ lệ lẻ cho 1 đơn vị tăng trong QUAN TRỌNG / TRỌNG LƯỢNG của biến
Tôi đã thấy thực hành này trên internet, nhưng không nơi nào tôi tìm thấy câu trả lời cho câu hỏi này. Liên kết này từ chính cộng đồng này có liên quan đến truy vấn có phần tương tự nơi ai đó đã viết:
WoE hiển thị một mối quan hệ tuyến tính với logarit tự nhiên của tỷ lệ cược là biến phụ thuộc trong hồi quy logistic. Do đó, câu hỏi về lỗi chính tả mô hình không xuất hiện trong hồi quy logistic khi chúng ta sử dụng WoE thay vì các giá trị thực của biến.
Nhưng tôi vẫn không nhận được lời giải thích. Xin hãy giúp tôi hiểu những gì tôi đang thiếu.