Đối với nhiệm vụ mô hình khuấy đảo, tôi đã xem xét:
- Tính toán cụm k cho dữ liệu
- Xây dựng mô hình k cho từng cụm riêng lẻ.
Lý do cho điều đó là, không có gì để chứng minh, rằng dân số của những người cho vay là đồng nhất, vì vậy thật hợp lý khi cho rằng quá trình tạo dữ liệu có thể khác nhau đối với các "nhóm" khác nhau
Câu hỏi của tôi là, nó là một phương pháp thích hợp? Nó có vi phạm bất cứ điều gì, hoặc nó được coi là xấu vì một số lý do? Nếu vậy, tại sao?
Nếu không, bạn sẽ chia sẻ một số thực tiễn tốt nhất về vấn đề đó? Và điều thứ hai - nói chung là tốt hơn hay tệ hơn khi làm tiền phát triển so với cây mô hình (Như được định nghĩa trong Witten, Frank - cây phân loại / hồi quy với các mô hình ở các lá. Theo trực giác, có vẻ như giai đoạn cây quyết định chỉ là một hình thức phân cụm khác, nhưng idk nếu nó có bất kỳ lợi thế nào so với phân cụm "bình thường".).