Tôi đã suy nghĩ, thực hiện và sử dụng mô hình Extreme Learning Machine (ELM) trong hơn một năm nay và càng làm lâu, tôi càng nghi ngờ rằng đó thực sự là một điều tốt. Tuy nhiên, ý kiến của tôi dường như trái ngược với cộng đồng khoa học nơi - khi sử dụng trích dẫn và các ấn phẩm mới làm thước đo - nó dường như là một chủ đề nóng.
ELM đã được giới thiệu bởi Huang et. al. khoảng năm 2003. Ý tưởng cơ bản khá đơn giản: bắt đầu với mạng nơ ron nhân tạo 2 lớp và gán ngẫu nhiên các hệ số trong lớp đầu tiên. Điều này, một biến đổi vấn đề tối ưu hóa phi tuyến tính thường được xử lý thông qua backpropagation thành một vấn đề hồi quy tuyến tính đơn giản. Chi tiết hơn, với , mô hình là
Bây giờ, chỉ có được điều chỉnh (để giảm thiểu mất bình phương lỗi-lỗi), trong khi các đều được chọn ngẫu nhiên. Để bù đắp cho sự mất mát về mức độ tự do, đề xuất thông thường là sử dụng một số lượng lớn các nút ẩn (ví dụ: tham số miễn phí ).v i k w i
Từ một góc độ (không phải là người thường phát huy trong các tài liệu, mà xuất phát từ phía mạng thần kinh), toàn bộ thủ tục là chỉ đơn giản là hồi quy tuyến tính, nhưng một trong những nơi bạn chọn chức năng cơ sở của bạn ngẫu nhiên, ví dụ
(Nhiều lựa chọn khác bên cạnh sigmoid có thể cho các hàm ngẫu nhiên. Chẳng hạn, nguyên tắc tương tự cũng đã được áp dụng bằng các hàm cơ sở xuyên tâm.)
Từ quan điểm này, toàn bộ phương pháp trở nên quá đơn giản và đây cũng là điểm khiến tôi bắt đầu nghi ngờ rằng phương pháp này thực sự là một phương pháp tốt (... trong khi tiếp thị khoa học của nó chắc chắn là). Vì vậy, đây là những câu hỏi của tôi:
Ý tưởng để raster không gian đầu vào bằng cách sử dụng các hàm cơ sở ngẫu nhiên, theo tôi, tốt cho kích thước thấp. Trong các chiều cao, tôi nghĩ rằng không thể tìm thấy một lựa chọn tốt bằng cách sử dụng lựa chọn ngẫu nhiên với số lượng cơ sở hợp lý. Do đó, ELM có suy giảm kích thước cao (do lời nguyền của chiều không)?
Bạn có biết kết quả thí nghiệm ủng hộ / mâu thuẫn với ý kiến này không? Trong bài báo được liên kết chỉ có một bộ dữ liệu hồi quy 27 chiều (PYRIM) trong đó phương thức thực hiện tương tự như SVM (trong khi tôi muốn xem so sánh với ANN backpropagation)
Tổng quát hơn, tôi muốn ở đây nhận xét của bạn về phương pháp ELM.