Kết hợp 1D trong mạng nơ ron


9

Tôi hiểu cách tích chập hoạt động nhưng tôi không hiểu cách áp dụng các kết hợp 1D cho dữ liệu 2D.

Tích chập 2D

Trong ví dụ này, bạn có thể thấy tích chập 2D trong dữ liệu 2D. Nhưng nó sẽ như thế nào nếu là tích chập 1D? Chỉ là một hạt nhân 1D trượt theo cùng một cách? Và nếu sải chân là 2?

Cảm ơn bạn!


1
Chỉ cần nhìn vào hàng đầu tiên của mỗi ma trận.
Piotr Migdal

Bạn có thể cho tôi một ví dụ?
Gustavo

Kết quả 1d sẽ không thực sự hữu ích cho hình ảnh 2d nghiêm ngặt. Hình ảnh không có thang độ xám là kỹ thuật 3D vì chúng có ba kênh màu.
Ethan

1
@Gustavo Thích cái này: toto-share.com/wp-content/uploads/2011/11/ trừ khi bạn có nghĩa là tích chập 1x1 (theo nghĩa của mạng nơ ron), đó là một điều khác.
Piotr Migdal

Vấn đề của tôi là với nhiều nếp cuộn như: d3kbpzbmcynnmx.cloudfront.net/wp-content/uploads/2015/11/... Có hai nếp cuộn, một với kích thước hạt nhân 3 và khác với kích thước 2 ... Nhưng những hạt nhân là 1D hoặc kích thước xk ?
Gustavo

Câu trả lời:



1

Các cấu trúc 1D được sử dụng trong các mạng chập để lấy mẫu xuống và lấy mẫu theo kích thước bộ lọc. Các mạng kết hợp xây dựng các bản đồ lọc này khi bạn đi qua mạng, bạn thực sự có thể nghĩ về chúng như một chiều thứ 3. Trường hợp cơ sở thông thường của kích thước bản đồ bộ lọc là kích thước 3, vì chúng ta sẽ thường có hình ảnh RGB đi qua mạng của mình.

Các kết cấu 1D này có thể hữu ích cho việc lấy mẫu xuống, thực hiện một số thao tác, sau đó lấy mẫu trở lại cùng chiều. Điều này khá hữu ích cho lý do hiệu suất.

Để thực sự hiểu được bằng trực giác, tôi khuyên bạn nên đọc:

Mạng trong mạng - http://arxiv.org/abs/1312.4400

Đi sâu hơn với các kết luận - https://www.google.com.vn/url?sa=t&source=web&rct=j&url=http://www.cs.unc.edu/~wliu/ con rrECNQ72wI3PH1Qw & sig2 = VhjfaMvuskNIDVKhFfNiqQ


4
Nó nói về các kết cấu 1x1 (theo nghĩa của các mạng thần kinh) chứ không phải là các cấu trúc 1D.
Piotr Migdal

Phải, tôi cho rằng các mạng lưới thần kinh có liên quan. Tôi đã bắt gặp một liên kết đến câu hỏi này trên / r / MLQuestions trên reddit vì vậy tôi cho rằng nó có liên quan đến ML. Nhưng đối với tích chập đơn giản thì điều này không liên quan: P.
Ethan
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.