Tự động điều chỉnh kiến ​​trúc NN: phát minh ra những thứ không cần thiết?


9

Tôi đang bắt đầu hành trình tiến sĩ của mình và mục tiêu cuối cùng mà tôi đặt ra trước bản thân là phát triển ANN để theo dõi môi trường họ làm việc và tự động điều chỉnh kiến ​​trúc của họ theo vấn đề. Hàm ý rõ ràng là tính tạm thời của dữ liệu: nếu bộ dữ liệu không liên tục và không thay đổi theo thời gian, tại sao lại điều chỉnh?

Câu hỏi lớn là: với sự gia tăng gần đây của học tập sâu, nó vẫn là một chủ đề có liên quan? Các FFNN có cơ hội để tìm cho mình một chỗ đứng trong các vấn đề trôi dạt khái niệm không?

Tôi sợ làm quá tải chủ đề với quá nhiều câu hỏi, nhưng câu hỏi này không hoàn toàn lạc đề: Tôi biết về RNN, nhưng tôi có kinh nghiệm hạn chế (ok, không, hoặc hoàn toàn là lý thuyết) với chúng; Tôi tin rằng thích ứng kiến ​​trúc động phải là một chủ đề có liên quan trong bối cảnh RNNs. Câu hỏi là, nó đã được trả lời chưa, và tôi sẽ phát minh lại cái bánh xe chứ?

PS được đăng chéo lên MetaOptizing


Khi bạn nói "điều chỉnh kiến ​​trúc của họ", bạn có nghĩa là các tham số (trọng số, độ lệch) hoặc cập nhật cấu trúc thực của mạng (các nút ẩn, chức năng kích hoạt, kết nối, v.v.)? Ngoài ra, trong nhiều ứng dụng học sâu, kết quả cuối cùng là mạng thần kinh chuyển tiếp nguồn cấp dữ liệu, chỉ một mạng có trọng số được khởi tạo bởi một số quy trình không giám sát.
alto

@alto, tôi đang đề cập đến cấu trúc NN thực tế - số lượng đơn vị ẩn và (có thể) các lớp - Tôi chắc chắn rằng nó có thể được thực hiện ở các mức độ phức tạp khác nhau. Tôi cảm thấy rằng tôi phải bắt đầu đọc lên việc học sâu nếu tôi ở bất cứ đâu.
anna-Earwen

@ anna-Earwen đề tài tiến sĩ thú vị, nó đang diễn ra như thế nào, có ấn phẩm nào chưa?
Dikran Marsupial

1
@Dikran Marsupial, tôi sẽ sớm đến IJCNN 2014 để nói về cách thức và lý do tại sao PSO không đào tạo các NN có chiều cao. Vì vậy, câu trả lời là có và biết: Tôi đã đi đường vòng lớn từ vectơ nghiên cứu ban đầu, và tôi tự hỏi liệu tôi có còn quay lại các kiến ​​trúc có thể điều chỉnh được không. Chỉ có thời gian và kết quả thực nghiệm sẽ cho biết!
anna-Earwen

Tôi sẽ xem xét nó trong quá trình tố tụng - hiểu lý do tại sao mọi thứ không hoạt động là thứ mà khoa học cần nhiều hơn (và nghiên cứu thực nghiệm vững chắc).
Dikran Marsupial

Câu trả lời:


6

Mạng thần kinh Cascade-Correlation điều chỉnh cấu trúc của chúng bằng cách thêm các nút ẩn trong quá trình đào tạo, vì vậy đây có thể là nơi để bắt đầu. Hầu hết các công việc khác mà tôi thấy là tự động điều chỉnh số lượng lớp, số nút ẩn, v.v. của mạng thần kinh sử dụng thuật toán tiến hóa.

Thật không may, công việc này nằm ngoài khu vực của tôi nên tôi không thể đề xuất bất kỳ giấy tờ hoặc tài liệu tham khảo cụ thể nào để giúp bạn bắt đầu. Tôi có thể nói với bạn rằng tôi chưa thấy bất kỳ công việc nào cố gắng cùng tối ưu hóa cấu trúc và tham số mạng trong cộng đồng học tập sâu. Trên thực tế, hầu hết các kiến ​​trúc học sâu đều dựa trên việc tham lam học một lớp duy nhất tại một thời điểm, do đó làm cho việc học trực tuyến các mạng thần kinh sâu trở thành một khu vực khá hoang sơ (công trình của Martens và cộng sự trên Hessian Free Optimization là một ngoại lệ đáng chú ý).


Cảm ơn rất nhiều, bạn đã cho tôi đủ thông tin để bắt đầu đào vàng. :)
anna-Earwen

2

Một lý do khác để xem xét việc phát triển các cách tiếp cận mới đối với các mạng thần kinh mang tính xây dựng (như thuật toán CC @alto đã đề cập) là trong các ứng dụng nằm ngoài số liệu thống kê . Đặc biệt, trong khoa học thần kinh lý thuyết và khoa học nhận thức, mạng lưới thần kinh mang tính xây dựng thường được sử dụng vì có sự tương đồng về mặt ẩn dụ với sự phát triển và sự hình thành thần kinh. Để biết ví dụ về việc sử dụng nhiều tương quan tầng cho việc này, hãy xem các ấn phẩm của Thomas R. Shultz . Thật không may, cách tiếp cận tương quan theo tầng là không thực tế về mặt sinh học và nếu bạn bị bẻ cong thần kinh học, đáng để xem xét làm thế nào các NN mới với kiến ​​trúc có thể điều chỉnh có thể được sử dụng như mô hình phát triển và / hoặc phát triển thần kinh tốt hơn.


1
Cảm ơn, Artem! Trên thực tế, tôi là một nhà khoa học máy tính thuần túy hơn bất kỳ ai khác, do đó kiến ​​thức về khoa học thần kinh và khoa học của tôi ít hơn là khan hiếm. Mặc dù âm thanh thú vị và vì tất cả các con đường vẫn mở, tôi cũng có thể đi sâu vào vấn đề này - ít nhất là ở một mức độ nào đó. Hiện tại tôi đặc biệt quan tâm đến các ứng dụng cho các vấn đề phân tích dữ liệu và kỹ thuật thực tế có thể hoạt động để đo điểm chuẩn.
anna-Earwen
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.