Trong nhiều thuật toán học máy, tính năng chia tỷ lệ (còn gọi là chia tỷ lệ biến, chuẩn hóa) là một bước chuẩn bị phổ biến Wikipedia - Tính năng mở rộng - câu hỏi này đã đóng Câu hỏi # 41704 - Làm thế nào và tại sao việc chuẩn hóa và nhân rộng tính năng hoạt động?
Tôi có hai câu hỏi cụ thể liên quan đến Cây quyết định:
- Có bất kỳ triển khai cây quyết định nào sẽ yêu cầu mở rộng tính năng không? Tôi có ấn tượng rằng hầu hết các tiêu chí phân tách của thuật toán là không phân biệt tỷ lệ.
- Hãy xem xét các biến này: (1) Đơn vị, (2) Giờ, (3) Đơn vị mỗi giờ - tốt nhất là để ba biến này "nguyên trạng" khi được đưa vào cây quyết định hoặc chúng ta gặp phải một số loại xung đột vì biến "chuẩn hóa" (3) có liên quan đến (1) và (2) không? Đó là, bạn sẽ tấn công tình huống này bằng cách ném cả ba biến vào hỗn hợp, hay bạn thường chọn một số kết hợp của ba hoặc đơn giản là sử dụng tính năng "chuẩn hóa / chuẩn hóa" (3)?