Sau khi được chuyển đổi thành dạng số, các mô hình không phản hồi khác với các cột được mã hóa nóng hơn so với bất kỳ dữ liệu số nào khác. Vì vậy, có một tiền lệ rõ ràng để bình thường hóa các giá trị {0,1} nếu bạn đang thực hiện nó vì bất kỳ lý do nào để chuẩn bị các cột khác.
Hiệu quả của việc này sẽ phụ thuộc vào lớp mô hình và loại chuẩn hóa mà bạn áp dụng, nhưng tôi đã nhận thấy một số cải tiến (nhỏ) khi chia tỷ lệ thành 0, std 1 cho dữ liệu phân loại được mã hóa một lần nóng, khi đào tạo mạng lưới thần kinh.
Nó cũng có thể tạo ra sự khác biệt cho các lớp mô hình dựa trên số liệu khoảng cách.
Thật không may, giống như hầu hết các loại lựa chọn này, thường thì bạn phải thử cả hai cách tiếp cận và chọn phương pháp có số liệu tốt nhất.