Nên một vectơ nóng được chia tỷ lệ với các thuộc tính số


20

Trong trường hợp có sự kết hợp của các thuộc tính phân loại và số, tôi thường chuyển đổi các thuộc tính phân loại thành một vectơ nóng. Câu hỏi của tôi là tôi có để các vectơ đó như là và chia tỷ lệ các thuộc tính số thông qua tiêu chuẩn hóa / chuẩn hóa hay tôi nên mở rộng một vectơ nóng cùng với các thuộc tính số?

Câu trả lời:


11

Sau khi được chuyển đổi thành dạng số, các mô hình không phản hồi khác với các cột được mã hóa nóng hơn so với bất kỳ dữ liệu số nào khác. Vì vậy, có một tiền lệ rõ ràng để bình thường hóa các giá trị {0,1} nếu bạn đang thực hiện nó vì bất kỳ lý do nào để chuẩn bị các cột khác.

Hiệu quả của việc này sẽ phụ thuộc vào lớp mô hình và loại chuẩn hóa mà bạn áp dụng, nhưng tôi đã nhận thấy một số cải tiến (nhỏ) khi chia tỷ lệ thành 0, std 1 cho dữ liệu phân loại được mã hóa một lần nóng, khi đào tạo mạng lưới thần kinh.

Nó cũng có thể tạo ra sự khác biệt cho các lớp mô hình dựa trên số liệu khoảng cách.

Thật không may, giống như hầu hết các loại lựa chọn này, thường thì bạn phải thử cả hai cách tiếp cận và chọn phương pháp có số liệu tốt nhất.


1
Các từ ngữ là một chút không rõ ràng. Bạn có nói rằng bạn chỉ bình thường hóa các cột được mã hóa nóng nếu bạn đã bình thường hóa bất kỳ cột không ohe nào?
Info5ek

@ Info5ek: Tôi đang nói rằng thể tốt hơn để bình thường hóa các cột được mã hóa nóng và nếu bạn đã thực hiện nó cho các cột khác thì bạn cũng có thể thử. Không có quy tắc cố định cho điều này, quá nhiều phụ thuộc vào vấn đề trong tay.
Neil Slater
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.