Tôi đang làm việc để phát triển một mô hình dự báo rủi ro bảo hiểm. Các mô hình này là "sự kiện hiếm" như dự đoán hàng không, phát hiện lỗi phần cứng, v.v. Khi tôi chuẩn bị bộ dữ liệu của mình, tôi đã thử áp dụng phân loại, nhưng tôi không thể có được các phân loại hữu ích vì tỷ lệ cao các trường hợp tiêu cực .
Tôi không có nhiều kinh nghiệm về thống kê và mô hình hóa dữ liệu ngoài khóa học thống kê ở trường trung học nên tôi hơi bối rối.
Như suy nghĩ đầu tiên, tôi đã nghĩ đến việc sử dụng mô hình quy trình Poisson không đồng nhất. Tôi đã phân loại nó dựa trên dữ liệu sự kiện (ngày, lat, lon) để có được ước tính tốt về khả năng rủi ro tại một thời điểm cụ thể vào một ngày cụ thể ở một địa điểm cụ thể.
Tôi muốn biết, các phương pháp / thuật toán để dự đoán các sự kiện hiếm gặp là gì?
Bạn đề nghị gì như một cách tiếp cận để giải quyết vấn đề này?