(Tại sao) SOM kiểu Kohonen không được ưa chuộng?


33

Theo như tôi có thể nói, các SOM theo phong cách Kohonen đã đạt đỉnh trở lại vào khoảng năm 2005 và gần đây không được ưa chuộng nhiều. Tôi chưa tìm thấy bất kỳ bài báo nào nói rằng các SOM đã được thay thế bằng một phương pháp khác, hoặc đã được chứng minh tương đương với một thứ khác (dù ở kích thước cao hơn, dù sao đi nữa). Nhưng có vẻ như tSNE và các phương pháp khác nhận được nhiều mực hơn bây giờ, ví dụ như trong Wikipedia, hoặc trong SciKit Learn, và SOM được đề cập nhiều hơn như một phương pháp lịch sử.

(Trên thực tế, một bài viết trên Wikipedia dường như chỉ ra rằng các SOM tiếp tục có những lợi thế nhất định so với các đối thủ cạnh tranh, nhưng đó cũng là mục ngắn nhất trong danh sách. EDIT: Per gung's request, một trong những bài viết mà tôi nghĩ đến là: Giảm kích thước phi tuyến Lưu ý rằng SOM ít viết về nó hơn các phương pháp khác. Tôi không thể tìm thấy bài viết đề cập đến một lợi thế mà các SOM dường như giữ lại so với hầu hết các phương pháp khác.)

Bất kỳ hiểu biết? Một số người khác hỏi tại sao SOMs không được sử dụng và đã có tài liệu tham khảo từ trước đó và tôi đã tìm thấy các thủ tục từ các hội nghị SOM, nhưng tự hỏi liệu sự gia tăng của SVM hay tSNE, et al, chỉ làm lu mờ SOMs trong học máy pop.

EDIT 2: Do sự trùng hợp hoàn toàn, tôi vừa đọc một cuộc khảo sát năm 2008 về việc giảm kích thước phi tuyến tối nay, và ví dụ nó chỉ đề cập đến: Isomap (2000), nhúng tuyến tính cục bộ (LLE) (2000), Hessian LLE (2003), Laplacian eigenmaps (2003) và nhúng semidefinite (SDE) (2004).


3
Bạn có thể liên kết đến bất kỳ tài nguyên nào bạn đang đề cập đến không? (Ví dụ, bài viết trên Wikipedia "dường như chỉ ra ..."?)
gung - Tái lập Monica

11
Họ dường như đã hết lòng với một mức độ mà tôi không biết SOM đề cập đến điều gì.
Matthew Drury

5
rõ ràng, bản đồ tự tổ chức
Christoph Hanck

SOM chỉ là một biến thể của thang đo đa chiều (MDS) cũ hơn nhiều.
kjetil b halvorsen

@kjetilbhalvorsen: Bạn có tài liệu tham khảo nào về SOM và MDS không? Theo tôi hiểu, MDS có bản chất toàn cầu (liên quan đến PCA), trong khi SOM mang tính chất địa phương. Hoặc có thể tôi hiểu nhầm họ.
Wayne

Câu trả lời:


18

Tôi nghĩ rằng bạn đang làm điều gì đó bằng cách lưu ý đến ảnh hưởng của những gì máy học hiện đang quảng cáo là thuật toán 'tốt nhất' để giảm kích thước. Mặc dù t-SNE đã cho thấy hiệu quả của nó trong các cuộc thi, như Thử thách Merck Viz , cá nhân tôi đã thành công khi thực hiện SOM cho cả trích xuất tính năng và phân loại nhị phân. Mặc dù chắc chắn có một số người đã loại bỏ SOM mà không cần biện minh ngoài tuổi của thuật toán (xem cuộc thảo luận này , cũng có một số bài báo đã được xuất bản trong vài năm qua đã triển khai SOM và đạt được kết quả tích cực (xem Mortazavi et al., 2013 ; Frenkel và cộng sự, 2013ví dụ). Một tìm kiếm Google Scholar sẽ tiết lộ rằng các SOM vẫn được sử dụng trong một số miền ứng dụng. Tuy nhiên, theo nguyên tắc chung, thuật toán tốt nhất cho một nhiệm vụ cụ thể chính xác là - thuật toán tốt nhất cho một nhiệm vụ cụ thể. Khi một khu rừng ngẫu nhiên có thể hoạt động tốt cho một nhiệm vụ phân loại nhị phân cụ thể, nó có thể thực hiện khủng khiếp trên một khu rừng khác. Điều tương tự cũng áp dụng cho các nhiệm vụ phân cụm, hồi quy và tối ưu hóa. Hiện tượng này được gắn với Định lý Không ăn trưa miễn phí , nhưng đó là một chủ đề cho một cuộc thảo luận khác. Tóm lại, nếu SOM hoạt động tốt nhất cho bạn trong một nhiệm vụ cụ thể, đó là thuật toán bạn nên sử dụng cho nhiệm vụ đó, bất kể những gì phổ biến.


5

Tôi đã thực hiện nghiên cứu về việc so sánh SOM với t-SNE và hơn thế nữa và cũng đề xuất một cải tiến về SOM đưa nó lên một cấp độ hiệu quả mới. Vui lòng kiểm tra nó ở đây và cho tôi biết phản hồi của bạn. Rất thích có được một số ý tưởng về những gì mọi người nghĩ về nó và nếu nó có giá trị xuất bản trong python cho mọi người sử dụng.

Liên kết IEEE tới giấy: http://ieeexplore.ieee.org/document/6178802/

Thực hiện Matlab. https://www.mathworks.com/matlabcentral/fileexchange/35538-cluster-reinfor thi--cr--phase

Cảm ơn phản hồi của bạn.


4
Chào mừng bạn đến với Xác thực chéo! Sẽ giúp đưa ra một bản tóm tắt ngắn gọn về những phát hiện của bạn, và sự cải thiện bạn đã thực hiện, và có lẽ để giải quyết câu hỏi trực tiếp hơn.
Scortchi - Phục hồi Monica

1

Quan điểm chủ quan của tôi là SOMs ít được biết đến và được coi là ít 'gợi cảm' hơn nhiều phương pháp khác, nhưng vẫn có liên quan cao đối với một số loại vấn đề nhất định. Nó cũng có thể là trường hợp mà họ sẽ có một đóng góp đáng kể để thực hiện nếu chúng được sử dụng rộng rãi hơn. Chúng là vô giá trong giai đoạn đầu của khoa học dữ liệu khám phá để cảm nhận về 'cảnh quan' hoặc 'cấu trúc liên kết' của dữ liệu đa biến.

Sự phát triển của các thư viện như Somoclu và nghiên cứu của Guénaël Cabanes (trong số nhiều người khác) cho thấy SOMs vẫn có liên quan.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.