Là chuyển đổi tính năng (sức mạnh, nhật ký, Box-Cox) cần thiết trong học tập sâu?


7

Tôi đã đọc được rằng có lợi khi áp dụng một số biến đổi tính năng phổ biến nhất định trên các bộ dữ liệu trước khi chúng đạt được các mô hình học máy. Chúng dựa trên sự phân phối các tính năng của bộ dữ liệu; ví dụ: áp dụng biến đổi nhật ký cho các tính năng phân phối thông thường bị lệch. Một số ví dụ ở đây .

Bây giờ theo tôi hiểu, một lợi ích chính của học sâu là "kỹ thuật tính năng tự động" (hay còn gọi là "học tính năng"). Tôi biết bao gồm các kết hợp tính năng; nhưng linh cảm của tôi nói rằng cũng bao gồm các biến đổi tính năng đã học theo các điều trên? Vì vậy, khi sử dụng các mạng sâu với các siêu âm được điều chỉnh tốt, các phép biến đổi tính năng có thể được gỡ bỏ một cách an toàn khỏi trách nhiệm của con người - nghĩa là, vứt bỏ tất cả các công cụ log / vuông / hộp-cox này không?

[Chỉnh sửa] Bổ sung: điều này cũng xử lý "lựa chọn tính năng" (quyết định những yếu tố đầu vào không bao gồm) cho bạn?

Câu trả lời:


1

Nguyên tắc chung là: bạn càng có nhiều dữ liệu, bạn càng ít quan tâm đến kỹ thuật tính năng (về cơ bản là đưa một số kiến ​​thức trước vào mô hình, dựa trên chuyên môn về miền).

Về mặt lý thuyết (với số lượng mẫu đủ lớn) bạn có thể giải quyết hình ảnh mà không cần sử dụng bất kỳ kết luận nào, chỉ có mạng lưới tiếp liệu sâu. Nhưng bằng cách biết rằng các pixel có tương quan về mặt không gian (điều này khiến cho các kết quả sẽ là cách tốt hơn để giải quyết vấn đề này), bạn có thể thiết kế một thuật toán hiệu quả dữ liệu hơn nhiều.


giải thích tốt đẹp của "tính năng kỹ thuật". Trong thế giới của tôi, điều này được xử lý bởi người dùng cung cấp danh sách các dự đoán có thể và mô hình bắt đầu ... sau đó niềm vui bắt đầu khi các tính năng được kiểm tra và phát hiện cấu trúc tiềm ẩn.
IrishStat

0

Vì vậy, cách tôi xem tính năng kỹ thuật ala-box cox là chúng tôi có một mô hình đòi hỏi sự bình thường, chúng tôi không có dữ liệu bình thường, vì vậy chúng tôi thực hiện một biến đổi để đưa chúng tôi vào Dữ liệu bình thường. Vì vậy, một mặt đúng là mạng nơ-ron không yêu cầu dữ liệu chuẩn hóa, vậy tại sao tính năng kỹ sư. Mặt khác, trong khi một mạng lưới thần kinh cuối cùng có thể đến đó, đôi khi tính năng kỹ thuật được thực hiện bởi con người có thể giúp ích rất nhiều cho tốc độ hội tụ ban đầu. Ví dụ, trong trường hợp dữ liệu tín hiệu đa kênh, thực hiện phân tách Fourier và tính toán các mối tương quan chéo trước sẽ làm tăng đáng kể tốc độ mà Mạng lưới thần kinh có thể phân loại (để đưa ra một ví dụ thực sự cụ thể). Hoặc để đưa ra một ví dụ lành mạnh hơn, nếu bạn biết dữ liệu của mình có nhiều ngoại lệ và những điều này không quan trọng, loại bỏ các ngoại lệ là một hình thức kỹ thuật tính năng. Mạng cuối cùng có thể học cách bỏ qua sau đó, nhưng nó có thể mất mãi mãi. Vì vậy, khi bạn khá chắc chắn rằng việc chuyển đổi sẽ làm nổi bật một cái gì đó quan trọng về dữ liệu của bạn, sau đó chuyển đổi nó, nếu không, thì có thể không.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.