CNN's vs Mật độ kết nối NN


7

Trong phân loại hình ảnh, chúng ta thường nói lý do chính của việc sử dụng CNN là vì NN được kết nối dày đặc không thể xử lý nhiều tham số (10 ^ 6 cho hình ảnh 1000 * 1000). Câu hỏi của tôi là, có bất kỳ lý do nào khác tại sao CNN được sử dụng trên DNN (NN được kết nối dày đặc) không?

Về cơ bản, nếu chúng ta có tài nguyên vô hạn thì DNN sẽ xử lý CNN hoặc CNN vốn rất phù hợp để phân loại hình ảnh vì RNN dành cho lời nói. Câu trả lời dựa trên toán học hoặc kinh nghiệm trên lĩnh vực này được đánh giá cao.

Câu trả lời:


2

Từ khóa ở đây là Chia sẻ thông số hoặc Chia sẻ trọng lượng trên các phần hình ảnh khác nhau.

Nếu chúng ta lấy một ví dụ đơn giản về hình ảnh nhị phân thang độ xám của bảng chữ cái 'F', thì đó là sự kết hợp của nhiều mẫu. Các mẫu ở đây là các đường thẳng đứng và đường ngang. Những mô hình này dựa trên mối quan hệ giữa cường độ của các tế bào tiếp giáp. Mối quan hệ này giữa các ô liền kề được thiết lập bằng ma trận trọng số.

Ngoài ra, để xác định nhiều đường ngang, chúng ta không cần nhiều tập hợp nút trong lớp dày đặc ẩn cố gắng xác định các đường ngang khác nhau trong ảnh. Các mô hình là như nhau nhưng hiện diện ở các địa điểm khác nhau. Do đó việc chia sẻ trọng lượng đi vào hình ảnh.

Trong lớp ẩn thứ 1, mã hóa đường ngang mẫu trong ma trận trọng số (được học trong quá trình đào tạo và được sử dụng trong thử nghiệm). Đặt nó trên lưới nhỏ và kiểm tra sự hiện diện. Khi ma trận này được trượt và thử nghiệm trên hình ảnh, sự hiện diện của các đường ngang được đánh dấu ở các vị trí khác nhau. Ma trận trọng lượng này được gọi là một hạt nhân.

Kết hợp các điểm trên, kernel cung cấp cách xử lý chia sẻ tham số / trọng số giữa các ô liền kề để xác định các mẫu. Lớp dày đặc thay vì hạt nhân cuối cùng sẽ giải quyết nó nhưng bắt đầu một cách ngẫu nhiên. Vì một cách hiệu quả đã được xác định, nó đang được sử dụng.

Tiếp theo để xác định các đường thẳng đứng, một hạt nhân khác cần thiết và trượt qua.

Giả sử tiếp theo chúng ta có lớp dày đặc là lớp ẩn thứ 2. Lớp này tìm kiếm sự kết hợp của các mẫu ('p' đường ngang và 'q' đường thẳng đứng trong trường hợp này cho 'F') và tìm hiểu các kết hợp để xác định đầu ra.

Chỉ cần so sánh với lập trình truyền thống, hạt nhân giống như các biểu thức thông thường. các lớp dày đặc giống như các vòng lặp. Chỉ chia sẻ suy nghĩ của tôi. Bất kỳ lời giải thích tốt hơn đều được chào đón.


2

Mạng thần kinh chuyển đổi có thể phát hiện nhiều tính năng không gian hơn so với Mạng kết nối dày đặc. Hãy xem xét điều này trong bất kỳ hình ảnh thực tế cụ thể nào, các giá trị pixel của các ô lân cận không khác nhau nhiều, nhưng khi hình ảnh này được chuyển đến mạng thần kinh được kết nối dày đặc để đào tạo mối quan hệ không gian giữa các pixel lân cận bị mất vì tất cả các ô khác có thể ảnh hưởng lớn đến đào tạo trong khi trong các mạng Convolutional do hoạt động tích chập bởi thông tin địa phương được bảo tồn, nó được gọi là kết nối cục bộ.


0

Đó không phải là lý do thực tế, các lớp "tích chập" được lấy cảm hứng từ các tế bào trong hệ thống thị giác. Điều này được bắt nguồn từ công việc của hubel-w Diesel. để biết thêm thông tin kiểm tra thí nghiệm hubel-w Diesel.


Đó là "cảm hứng" nhưng nhiều hệ thống tồn tại mà không tuân theo hubel weisel vẫn hoạt động tốt hơn, còn hubes wesiel được đưa ra giả thuyết và tôi nghĩ là chính xác trừ khi được chứng minh là sai
DuttaA

"Đó là" cảm hứng "nhưng nhiều hệ thống tồn tại mà không tuân theo hubel w Diesel vẫn hoạt động tốt hơn" hệ thống nào thực hiện nhiệm vụ nào? đối với hầu hết tất cả các nhiệm vụ liên quan đến phân loại hình ảnh, mạng tích chập hoạt động tốt hơn, và điểm chính của hubel và w Diesel là hệ thống hình ảnh phản hồi theo cách "cục bộ".
riemann77

việc sử dụng các bộ lọc chỉ để giảm tính toán ... một dNN cũng là một bộ lọc ... Có thể dễ dàng đạt được một đầu ra cho một kênh rgb duy nhất (về cơ bản là một cnn nhưng các bộ lọc ở một lớp cụ thể thì khác toàn bộ hình ảnh, một bộ lọc khổng lồ bao trùm toàn bộ hình ảnh, tôi có thể sử dụng nhiều bộ lọc khổng lồ và xây dựng một dnn), trong khi đó, bộ lọc chính của cnn là phát hiện cạnh, không có lý do gì để hệ thống kết nối dày đặc này không hoạt động tốt hơn bộ lọc thông thường cho tất cả
DuttaA

"Tôi có thể sử dụng nhiều bộ lọc khổng lồ và xây dựng một dnn" bạn sẽ kết thúc quá mức
riemann77

Đó không phải là điểm có nhiều phương pháp để ngăn chặn điều đó
DuttaA
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.