Như @David Masip đã đề cập, Phân tích thành phần chính sẽ là một phương pháp tốt để sử dụng ở đây. Về cơ bản, PCA là một phương pháp mà ánh xạ được tìm thấy giữa không gian chiều cao đến không gian chiều thấp hơn trong khi vẫn giữ càng nhiều biến đổi trong dữ liệu càng tốt - hoàn hảo để giảm dữ liệu chiều cao.
Tuy nhiên, bạn đề cập rằng bạn muốn sử dụng dữ liệu giảm này để đào tạo một mô hình mạng thần kinh. Trước tiên, có thể tốt nhất là đào tạo mô hình mạng lưới thần kinh và xem nó hoạt động tốt như thế nào, vì mạng lưới thần kinh thường rất tốt trong việc xác định các tương tác giữa các tính năng cũng như các cấu trúc ẩn khác trong dữ liệu. Nếu nó không hoạt động tốt, thì một cách tiếp cận để cải thiện hiệu suất có thể là sử dụng PCA - mặc dù điều này phụ thuộc nhiều vào trường hợp sử dụng, nội dung / loại / lượng dữ liệu, kiến trúc mạng thần kinh, v.v.
ps PCA cũng tốt để trực quan hóa dữ liệu chiều cao (giảm kích thước xuống còn 2 hoặc 3 chiều, sau đó vẽ đồ thị. Điều này tốt hơn là chỉ vẽ 2 tính năng tại một thời điểm như bạn đã làm ở trên).