Mạng lưới thần kinh sâu - Chỉ để phân loại hình ảnh?


14

Tất cả các ví dụ tôi tìm thấy bằng cách sử dụng niềm tin sâu sắc hoặc mạng lưới thần kinh tích chập sử dụng chúng để phân loại hình ảnh, phát hiện vi khuẩn hoặc nhận dạng giọng nói.

Các mạng nơ ron sâu cũng có ích cho các tác vụ hồi quy cổ điển, trong đó các tính năng không được cấu trúc (ví dụ: không được sắp xếp theo thứ tự hoặc lưới)? Nếu có, bạn có thể đưa ra một ví dụ?


3
Câu đầu tiên của bạn đưa lên mạng lưới thần kinh tích chập. Có vẻ như bạn đang nhầm lẫn chúng với các mạng lưới niềm tin sâu sắc. Chúng không giống nhau, mặc dù cả hai đều là dạng mạng lưới thần kinh.
MSalters

1
Tôi đồng ý với @msalters, nhưng sẽ nói rằng các mạng niềm tin sâu sắc là các mạng thực sự sâu rộng và đã thành công hạn chế, trong khi các mạng chập giống như một bộ lọc hình ảnh thích nghi lai trong các lớp chập theo sau là nn nông.
seanv507

Bạn có ý nghĩa gì khi "quan sát" là "không có cấu trúc (không được sắp xếp theo trình tự hoặc lưới)"? Bạn có đề cập đến hình ảnh được "cấu trúc" theo nghĩa các pixel riêng lẻ được sắp xếp trên một lưới không? Nhưng sau đó, các tính năng là "có cấu trúc", không phải là "quan sát" (đó sẽ là những hình ảnh riêng lẻ)?
amip nói rằng Phục hồi lại

Tôi muốn nói rằng tất cả các mạng Convolution đều sâu, không phải tất cả các mạng sâu đều là tích chập, và tương tự tất cả các mạng niềm tin sâu đều sâu, không phải tất cả các mạng sâu đều là mạng niềm tin sâu. Thật vậy, bạn có thể có các mạng sâu không sâu cũng không tích chập, chúng chỉ có xu hướng khó đào tạo. Chắc chắn có phạm vi cho cuộc tranh luận vô nghĩa về thuật ngữ mặc dù.
Lyndon White

Bạn không thể áp dụng mạng tích chập cho dữ liệu phi cấu trúc (không theo chuỗi / lưới, v.v.). Về cơ bản nó không có ý nghĩa. Mạng tích chập có liên quan chặt chẽ đến việc lấy biến đổi Fourier của đầu vào của bạn - ví dụ: cho các chuỗi chuyển đổi nó từ miền thời gian sang miền tần số.
Lyndon White

Câu trả lời:


8

Các đặc điểm của hình ảnh giúp chúng có thể phân loại với mạng thần kinh sâu là có rất nhiều tính năng (có thể là hàng triệu nếu không phải là hàng tỷ pixel với RGB, cường độ, v.v.) và nếu bạn có nhãn chính xác, đó không phải là dữ liệu ồn ào. Máy ảnh những ngày này là rất tốt và họ không đo lường bất cứ điều gì. Nhờ có Internet, giờ đây chúng ta có rất nhiều hình ảnh được dán nhãn chính xác. Một mạng sâu có thể biểu thị các chức năng phức tạp tùy ý, đó là một vấn đề với dữ liệu nhiễu vì bạn có thể rất dễ điều chỉnh nhiễu, do đó tại sao nhiều phương pháp học tập có xu hướng xử phạt các mô hình phức tạp. Tuy nhiên, trong trường hợp nhận dạng hình ảnh, chức năng thực sự có vẻ rất phức tạp, chúng tôi không biết hình thức chức năng trông như thế nào và thậm chí chúng tôi không biết các tính năng liên quan trong nhiều trường hợp là gì.

Điều này không có nghĩa là bạn không thể sử dụng các mạng sâu để tìm hiểu các chức năng không liên quan gì đến hình ảnh. Bạn chỉ cần hết sức cẩn thận về những nhược điểm, chủ yếu là nó rất dễ bị quá tải, nhưng cũng tốn kém về mặt tính toán và có thể mất nhiều thời gian để đào tạo (không phải là vấn đề ngày nay với SGD và GPU song song). Nhược điểm khác là bạn có rất ít hoặc không có khả năng diễn giải mô hình, điều này không thực sự quan trọng đối với phân loại hình ảnh. Chúng tôi chỉ đang cố gắng để máy tính nhận ra sự khác biệt giữa một con tinh tinh và một con đười ươi. Sự hiểu biết của con người về công thức không thành vấn đề. Đối với các lĩnh vực khác, đặc biệt là chẩn đoán y tế, nghiên cứu chính sách, v.v., bạn muốn hoặc thậm chí có thể cần sự hiểu biết của con người.


5

Chắc chắn bạn có thể sử dụng mạng lưới thần kinh sâu cho nhiều vấn đề ngoài nhận dạng hình ảnh hoặc giọng nói. Vấn đề là nếu bạn thực sự cần nó.

Mạng lưới thần kinh sâu mạnh hơn nhiều so với MLP đơn giản tuy nhiên chúng cũng tốn nhiều tài nguyên hơn và khó phát triển hơn. Vì vậy, chúng được sử dụng trong các lĩnh vực thực sự phức tạp. Bạn có thể sử dụng chúng để giải quyết các vấn đề dễ dàng hơn nhưng thông thường các mô hình đơn giản hơn cũng thu được kết quả tốt.

Sử dụng mạng lưới thần kinh sâu cho các vấn đề dễ dàng sẽ giống như giết ruồi bằng bazooka, chắc chắn bạn sẽ giết chúng nhưng bạn không thể tìm ra cách đơn giản hơn?


2
Đây là một câu trả lời không. Cái gì dễ thì cái gì khó? Dự đoán thị trường chứng khoán / ngoại suy từ các ví dụ hạn chế / ... CÓ rất nhiều vấn đề khó khăn có sâu sắc không?
seanv507

Tôi đã không nói rằng các mạng lưới thần kinh sâu có thể giải quyết bất cứ điều gì. Ý tôi là chúng được sử dụng trong các lĩnh vực phức tạp nơi bạn có số lượng mục lớn. Tôi biết rằng họ không thể giải quyết mọi vấn đề nhưng đó không phải là vấn đề trong câu hỏi này. Vấn đề là nhấn mạnh rằng chúng có thể được áp dụng cho các vấn đề khác ngoài nhận dạng hình ảnh / giọng nói nhưng chúng có những nhược điểm đáng để xem xét trong các trường hợp các mô hình khác có thể được áp dụng.
davidivad

5

Tôi đồng ý với câu trả lời của davidivad. Nhưng tôi cũng nghĩ rằng ứng dụng của mạng nơ ron sâu vào hình ảnh là hình ảnh (và quan trọng hơn hình ảnh được dán nhãn ) tương đối rẻ tiền để thu thập. Trong các lĩnh vực khác, việc thu thập dữ liệu trên quy mô lớn có thể rất tốn kém, đặc biệt là trong các ràng buộc của một doanh nghiệp công nghiệp hoặc chính phủ điển hình. Vấn đề này là trong nhiều ứng dụng, hiện tượng quan tâm là tương đối hiếm, do đó sẽ có một vài ví dụ quý giá để học hỏi, do đó, ngay cả một nỗ lực thu thập dữ liệu quy mô tương đối lớn cũng có thể mang lại một số lượng nhỏ thành viên của một số lớp.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.