Các phương pháp mà các thuật toán học cây quyết định sử dụng để đối phó với các giá trị còn thiếu là gì.
Có phải họ chỉ đơn giản là điền vào chỗ trống trong việc sử dụng một giá trị được gọi là thiếu?
Cảm ơn.
Các phương pháp mà các thuật toán học cây quyết định sử dụng để đối phó với các giá trị còn thiếu là gì.
Có phải họ chỉ đơn giản là điền vào chỗ trống trong việc sử dụng một giá trị được gọi là thiếu?
Cảm ơn.
Câu trả lời:
Có một số phương pháp được sử dụng bởi các cây quyết định khác nhau. Chỉ cần bỏ qua các giá trị bị thiếu (như ID3 và các thuật toán cũ khác) hoặc coi các giá trị bị thiếu là một loại khác (trong trường hợp tính năng danh nghĩa) không thực sự xử lý các giá trị bị thiếu. Tuy nhiên, những cách tiếp cận này đã được sử dụng trong giai đoạn đầu phát triển cây quyết định.
Các phương pháp xử lý thực tế đối với dữ liệu bị thiếu không sử dụng điểm dữ liệu với các giá trị bị thiếu trong đánh giá phân tách. Tuy nhiên, khi các nút con được tạo và huấn luyện, các trường hợp đó được phân phối bằng cách nào đó.
Tôi biết về các cách tiếp cận sau để phân phối các thể hiện giá trị bị thiếu cho các nút con: