Tôi ngạc nhiên rằng tôi không thể tìm thấy bất kỳ bài viết / bài giảng nào về cách người ta có thể kết hợp Phân phối Xác suất của Lớp trước trong các phân loại như Hồi quy logistic hoặc Rừng ngẫu nhiên.
Vì vậy, câu hỏi của tôi là:
Làm thế nào có thể kết hợp phân phối xác suất lớp trước trong hồi quy logistic hoặc rừng ngẫu nhiên?
Có phải việc kết hợp phân phối xác suất trước lớp có ngụ ý rằng tôi nên sử dụng máy móc Bayes không?
Tôi đang đối mặt với một nhiệm vụ phân loại nơi tôi biết rằng lớp a có nhiều khả năng hơn lớp b.
Một giải pháp adhoc sẽ chỉ bao gồm nhiều mẫu hơn cho lớp a trong tập huấn luyện, nhưng có kết quả lý thuyết nào về điều này không?
Một điều tôi nghĩ là thay đổi ngưỡng quyết định từ 0,5 thành giá trị có tính đến sự mất cân bằng trước đó. Nhưng tôi thậm chí không chắc liệu điều đó có hợp lý về mặt lý thuyết hay không, bởi vì tại thời điểm tôi sẵn sàng đưa ra quyết định, tôi đã xem xét tất cả các giá trị tính năng nên tôi không nên quan tâm đến xác suất trước mà là xác suất có điều kiện của lớp.