Tất cả các loại mạng thần kinh khác nhau được sử dụng để làm gì?


11

Tôi tìm thấy bảng cheat mạng thần kinh sau đây ( Cheat Sheets cho AI, Mạng thần kinh, Học máy, Học sâu & Dữ liệu lớn ).

nhập mô tả hình ảnh ở đây

Tất cả các loại mạng thần kinh khác nhau được sử dụng để làm gì? Ví dụ, mạng thần kinh nào có thể được sử dụng để hồi quy hoặc phân loại, mạng nào có thể được sử dụng để tạo chuỗi, v.v.? Tôi chỉ cần một cái nhìn tổng quan ngắn gọn (1-2 dòng) về các ứng dụng của họ.


1
Câu hỏi này quá rộng, nếu bạn muốn biết các ứng dụng cho từng mạng được minh họa. Đặt một câu hỏi liên quan đến một mạng cụ thể.
nbro

1
Nbro là chính xác rằng đây là một câu hỏi cực kỳ rộng. Nhưng bạn đã kiếm được một số thiện chí khi đăng một hình ảnh tuyệt vời như vậy, vì vậy tôi đang chờ đóng cửa chờ đợi thêm các cộng đồng từ cộng đồng. (Hãy xem liệu nó có mang lại câu trả lời hay không - mặc dù rộng, một bản tóm tắt về khả năng áp dụng cho các biến thể khác nhau chắc chắn sẽ có giá trị.)
DukeZhou

2
Tôi biết nó rộng, nhưng chỉ một vài dòng cơ bản cho từng loại mạng, ok?
datdinhquoc

2
@DukeZhou Tôi đã đâm nó, nhưng điều này gần như cảm thấy nó nên là một wiki cộng đồng.
John Doucette

Câu trả lời:


8

Tôi đồng ý rằng điều này quá rộng, nhưng đây là câu trả lời 1 câu cho hầu hết trong số họ. Những cái tôi bỏ đi (từ dưới cùng của biểu đồ) rất hiện đại, và rất chuyên biệt. Tôi không biết nhiều về họ, vì vậy có lẽ ai đó có thể cải thiện câu trả lời này.

  • Perceptron: Hồi quy tuyến tính hoặc logistic (và do đó, phân loại).
  • Chuyển tiếp thức ăn: Thường là hồi quy phi tuyến tính hoặc phân loại với kích hoạt sigmoidal. Về cơ bản là một tri giác nhiều lớp.
  • Radial Basis Network: Feed Forward Network với các chức năng kích hoạt Radial Basis. Được sử dụng để phân loại và một số loại lọc video / âm thanh
  • Deep Feed Forward: Feed Forward với hơn 1 lớp ẩn. Được sử dụng để tìm hiểu các mẫu phức tạp hơn trong phân loại hoặc hồi quy, có thể củng cố việc học.

  • Mạng thần kinh tái phát: Mạng chuyển tiếp nguồn cấp dữ liệu sâu nơi một số nút kết nối với các lớp trong quá khứ . Được sử dụng trong học tập củng cố và để học các mẫu trong dữ liệu tuần tự như văn bản hoặc âm thanh.
  • LSTM: Một mạng lưới thần kinh tái phát với các nơ-ron điều khiển chuyên biệt (đôi khi được gọi là cổng) cho phép các tín hiệu được ghi nhớ trong thời gian dài hơn hoặc bị lãng quên có chọn lọc. Được sử dụng trong bất kỳ ứng dụng RNN nào và thường có thể học các chuỗi có thời gian lặp lại rất dài.
  • GRU: Giống như LSTM, một loại RNN có kiểm soát khác với các tế bào thần kinh kiểm soát chuyên biệt.

  • Auto Encoder: Học cách nén dữ liệu và sau đó giải nén nó. Sau khi tìm hiểu mô hình này, nó có thể được chia thành hai phần con hữu ích: ánh xạ từ không gian đầu vào sang không gian đặc trưng chiều thấp, có thể dễ hiểu hoặc dễ hiểu hơn; và ánh xạ từ một không gian con chiều nhỏ của các số đơn giản thành các mẫu phức tạp, có thể được sử dụng để tạo ra các mẫu phức tạp đó. Cơ sở của nhiều công việc hiện đại trong tầm nhìn, ngôn ngữ và xử lý âm thanh.
  • VAE, DAE, SAE: Chuyên ngành của Bộ mã hóa tự động.

  • Chuỗi Markov: Một đại diện mạng thần kinh của chuỗi markov: Trạng thái được mã hóa trong tập hợp các nơ-ron đang hoạt động và do đó xác suất chuyển tiếp được xác định bởi các trọng số. Được sử dụng để học xác suất chuyển tiếp và học tính năng không giám sát cho các ứng dụng khác.
  • HN, BM, RBM, DBM: Các kiến ​​trúc chuyên ngành dựa trên ý tưởng Chuỗi Markov, được sử dụng để tự động tìm hiểu các tính năng hữu ích cho các ứng dụng khác.

  • Mạng kết hợp sâu: Giống như mạng chuyển tiếp nguồn cấp dữ liệu, nhưng mỗi nút thực sự là một ngân hàng của các nút học cách tích chập từ lớp trước nó. Điều này về cơ bản cho phép nó tìm hiểu các bộ lọc, máy dò cạnh và các mô hình quan tâm khác trong xử lý video và âm thanh.

  • Mạng giải mã sâu: Đối diện với mạng kết hợp theo một nghĩa nào đó. Tìm hiểu ánh xạ từ các tính năng thể hiện các cạnh hoặc các thuộc tính cấp cao khác của một số hình ảnh không nhìn thấy, trở lại không gian pixel. Tạo hình ảnh từ bản tóm tắt.

  • DCIGN: Về cơ bản là một bộ mã hóa tự động được tạo từ DCN và DN bị mắc kẹt với nhau. Được sử dụng để tìm hiểu các mô hình tổng quát cho hình ảnh phức tạp như khuôn mặt.

  • Mạng đối thủ tạo: Được sử dụng để tìm hiểu các mô hình tổng quát cho các hình ảnh phức tạp (hoặc các loại dữ liệu khác) khi không có đủ dữ liệu đào tạo cho một DCIGN. Một mô hình học cách tạo dữ liệu từ nhiễu ngẫu nhiên và mô hình kia học cách phân loại đầu ra của mạng đầu tiên khác với bất kỳ dữ liệu đào tạo nào có sẵn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.