Làm thế nào để chọn các tính năng cho một mạng lưới thần kinh?


16

Tôi biết rằng không có câu trả lời rõ ràng cho câu hỏi này, nhưng giả sử rằng tôi có một mạng lưới thần kinh khổng lồ, với rất nhiều dữ liệu và tôi muốn thêm một tính năng mới trong đầu vào. Cách "tốt nhất" sẽ là kiểm tra mạng với tính năng mới và xem kết quả, nhưng có phương pháp nào để kiểm tra xem tính năng này có hữu ích không? Giống như các biện pháp tương quan ( http://www3.nd.edu/~mclark19/learn/CorrelationComparison.pdf ) vv?


1
Một mối tương quan không ngẫu nhiên có thể là một chỉ báo cho thấy tính năng này hữu ích. Nhưng tôi không chắc lắm về các bài kiểm tra trước khi đào tạo có thể loại trừ ý tưởng. Bài báo bạn liên kết cho thấy rõ rằng các mối tương quan phi tuyến tính không được phát hiện tốt bởi các thử nghiệm có sẵn, nhưng một mạng lưới thần kinh có cơ hội tìm và sử dụng chúng.
Neil Slater

Câu trả lời:


16

Một mối tương quan rất mạnh giữa tính năng mới và tính năng hiện có là một dấu hiệu khá tốt cho thấy tính năng mới cung cấp ít thông tin mới. Một mối tương quan thấp giữa tính năng mới và các tính năng hiện có có khả năng thích hợp hơn.

Một mối tương quan tuyến tính mạnh mẽ giữa tính năng mới và biến dự đoán là một dấu hiệu tốt cho thấy một tính năng mới sẽ có giá trị, nhưng việc không có mối tương quan cao là không cần thiết là một dấu hiệu của một tính năng kém, bởi vì các mạng thần kinh không bị hạn chế đối với các kết hợp tuyến tính của các biến.

Nếu tính năng mới được xây dựng thủ công từ sự kết hợp của các tính năng hiện có, hãy xem xét loại bỏ nó. Vẻ đẹp của mạng lưới thần kinh là ít kỹ thuật tính năng và tiền xử lý được yêu cầu - thay vào đó các tính năng được học bởi các lớp trung gian. Bất cứ khi nào có thể, thích học các tính năng để kỹ thuật chúng.


Tôi luôn nghĩ so sánh giá trị để dự đoán với các tính năng, bạn đang nói về mối tương quan giữa các tính năng. Là câu trả lời của bạn cũng áp dụng cho trường hợp của tôi? về lý thuyết tôi chỉ nên thêm các tính năng mới tương quan với giá trị để dự đoán, phải không?
marcodena

Đó cũng là một số liệu có giá trị - chỉ cần cập nhật câu trả lời của tôi để giải quyết vấn đề đó.
Madison ngày

Tóm lại, tương quan mạnh mẽ với giá trị để dự đoán là một dấu hiệu tuyệt vời, nhưng tương quan yếu với giá trị để dự đoán không nhất thiết là một dấu hiệu xấu.
Madison ngày

Cảm ơn. Tôi đang viết báo cáo và tôi muốn hiển thị các mối tương quan tuyến tính / phi tuyến tính để chứng minh các tính năng (ngay cả trước khi có kết quả). Liệu no co y nghia gi? Từ câu trả lời của bạn, tôi có thể tạo ra một ma trận tương quan nhưng có lẽ nó vô nghĩa
marcodena

1
Tôi sẽ sử dụng các tương quan phi tuyến tính, nhưng ok cảm ơn
marcodena

0

Nếu bạn đang sử dụng sklearn, có một chức năng tốt có tên là model.feature_importances_. Hãy dùng thử với mô hình / tính năng mới của bạn và xem nếu nó giúp. Cũng xem ở đâyở đây cho ví dụ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.