Tôi đã đọc được rằng có lợi khi áp dụng một số biến đổi tính năng phổ biến nhất định trên các bộ dữ liệu trước khi chúng đạt được các mô hình học máy. Chúng dựa trên sự phân phối các tính năng của bộ dữ liệu; ví dụ: áp dụng biến đổi nhật ký cho các tính năng phân phối thông thường bị lệch. Một số ví dụ ở đây .
Bây giờ theo tôi hiểu, một lợi ích chính của học sâu là "kỹ thuật tính năng tự động" (hay còn gọi là "học tính năng"). Tôi biết bao gồm các kết hợp tính năng; nhưng linh cảm của tôi nói rằng cũng bao gồm các biến đổi tính năng đã học theo các điều trên? Vì vậy, khi sử dụng các mạng sâu với các siêu âm được điều chỉnh tốt, các phép biến đổi tính năng có thể được gỡ bỏ một cách an toàn khỏi trách nhiệm của con người - nghĩa là, vứt bỏ tất cả các công cụ log / vuông / hộp-cox này không?
[Chỉnh sửa] Bổ sung: điều này cũng xử lý "lựa chọn tính năng" (quyết định những yếu tố đầu vào không bao gồm) cho bạn?