Sự khác biệt giữa một lĩnh vực tiếp nhận và bản đồ tính năng là gì?


9

Trong CNN, trường tiếp nhận là phần hình ảnh được sử dụng để tính toán đầu ra của bộ lọc. Nhưng đầu ra của một bộ lọc (còn được gọi là "bản đồ đặc trưng") là đầu vào của bộ lọc tiếp theo.

Sự khác biệt giữa một lĩnh vực tiếp nhận và bản đồ tính năng là gì?

Câu trả lời:


4

Lĩnh vực tiếp nhận

Trường tiếp nhận , trong ngữ cảnh của cơ học CNN, là phạm vi đầu vào riêng biệt được chọn làm đầu vào cho hạt nhân chập của một lớp cụ thể. Phạm vi của một lĩnh vực tiếp nhận là một chức năng của cả vị trí và kích thước. Phạm vi áp dụng cho một hoặc nhiều kích thước. 1

  • Ngang
  • Theo chiều dọc
  • Chỉ số khung
  • Tăng thời gian
  • Chỉ số lớp pixel
  • Kích thước khác

Vị trí của trường tiếp nhận được thay đổi một cách có hệ thống để chọn một tập hợp con của phạm vi các chỉ số trong mỗi thứ nguyên để bao quát toàn bộ phạm vi. 2 Kích thước được khớp với đầu vào của kernel hoạt động theo nó và do đó thường không đổi. 3

Đây là ba đặc điểm xác định của các lĩnh vực tiếp nhận trong CNN.

  • Chỉ định phạm vi các chỉ mục được chọn cho đầu vào vào hạt nhân chập về vị trí và kích thước chỉ mục
  • Kích thước của phạm vi chỉ mục trong mỗi thứ nguyên (thường là lẻ và nhỏ hơn 20) khớp với các đặc điểm kích thước đầu vào của nhân
  • Vị trí của phạm vi chỉ mục trong mỗi thứ nguyên, được thay đổi một cách có hệ thống để bao quát toàn bộ phạm vi thông tin trong tất cả các thứ nguyên, thường được thay đổi theo gia số cố định

Lưu ý rằng thuật ngữ Trường tiếp nhận bắt nguồn từ giới hạn biểu thị tín hiệu của trường thị giác được ghi lại trong các hệ thống sinh học. Trong bối cảnh này, thuật ngữ Lĩnh vực tiếp nhận dùng để chỉ phạm vi hình học có được thông qua các thiết bị hình ảnh hoặc các cơ quan. Giống như một con mắt có thể quét một phong cảnh, việc lựa chọn một vị trí trong toàn bộ trường thông tin xảy ra trong thiết kế CNN.

Điểm chung giữa sinh học và nhân tạo là việc sử dụng thay đổi trọng tâm của sự chú ý trên toàn bộ không gian cảm giác.

Bản đồ tính năng như là một đại diện của các tính năng được trích xuất

Thuật ngữ Bản đồ đặc trưng trong ngữ cảnh này là bản đồ biểu thị các tính năng được trích xuất thông qua một hoặc nhiều lớp tích chập. Thuật ngữ này có thể được sử dụng không chính xác cho đầu ra trung gian của hạt nhân, nhưng lưu ý rằng đầu ra của các lớp trung gian trước các lớp được gộp chung chưa thể hiện trực tiếp các tính năng. Trong các giai đoạn đó, trích xuất không đầy đủ, do đó không có mối quan hệ trực tiếp giữa các giá trị và tính năng.

Thuật ngữ bản đồ tính năng được sử dụng chính xác nhất khi mô tả đầu ra của lớp gộp cuối cùng trong một phần của các lớp CNN. Phần này có thể nằm trong một chuỗi các phần CNN hoặc có thể là các thành phần trong kiến ​​trúc hệ thống lớn hơn.

Ví dụ về ánh xạ tính năng bao gồm những điều này.

  • Cạnh
  • Xuất hiện hoặc biến mất (miền thời gian)
  • Các yếu tố đối tượng
  • Quỹ đạo chuyển động
  • Thu phóng
  • Các đối tượng
  • Hành động

Trong cách sử dụng thuật ngữ này, việc ánh xạ các tính năng có liên quan đến kích thước của thông tin, không gian vị trí mà hạt nhân được áp dụng.

Bản đồ đặc trưng như một đại diện của một biến đổi trong không gian Hilbert rời rạc

Khi thuật ngữ Bản đồ đặc trưng được áp dụng cho ánh xạ được hoàn thành bởi một hoặc một nhóm các lớp CNN, các tính năng ở đầu ra được ánh xạ tới đầu vào, không phải cho các vị trí. Trong bối cảnh này, ánh xạ là phép biến đổi tenxơ trong Không gian Hilbert. Lưu ý rằng bản đồ không phải là biểu diễn của tín hiệu mà là biểu diễn của phép biến đổi, hạt nhân và các tham số đã học của nó ở trạng thái hiện tại.

Để phân biệt bối cảnh này với bối cảnh trước đó, có thể hữu ích khi sử dụng thuật ngữ Ánh xạ tính năng để chỉ ra một phép biến đổi tenxơ thay vì đầu ra của phép biến đổi đó.

Chồng chéo các Điều khoản

Khi đầu ra của phần tích chập chứa bản đồ các tính năng và được đưa vào một phần hoặc phần tích chập khác, bản đồ tính năng của một phần sẽ trở thành không gian đầy đủ mà trường tiếp nhận chọn tập hợp thông tin được đưa vào nhân tiếp theo như đầu vào.

Lưu ý rằng bản đồ đặc trưng là tín hiệu hoàn chỉnh đại diện cho tất cả dữ liệu trong phần mạng của nó, trong đó trường nhận thường là một tập hợp con của tín hiệu hoàn chỉnh được áp dụng nhiều lần để bao quát toàn bộ chiều rộng của tín hiệu theo nhiều chiều.

Hai thuật ngữ này không đồng nghĩa trong bất kỳ bối cảnh nào mà chỉ liên quan đến lý thuyết và thực tiễn.

Chú thích

[1] Cả vị trí và kích thước được chỉ định trong mỗi n kích thước trong Tôin, Ở đâu n1.

[2] Việc lựa chọn các phạm vi trong mỗi thứ nguyên có thể được thực hiện thông qua việc lặp trong các thuật toán hoặc thông qua các giải pháp phần cứng thực hiện các hoạt động cửa sổ với mạch DSP hoặc GPU, có thể được thực hiện thông qua các hoạt động RISC song song được điều khiển bằng phần cứng hoặc phần sụn.

[3] Các chỉ số ví dụ và kỷ nguyên có thể được giới hạn tương tự trong một số thiết kế CNN, nhưng các chỉ số đó không, theo nghĩa thông thường của thuật ngữ, được coi là một phần của các lĩnh vực tiếp nhận. Chỉ có kích thước trong mỗi ví dụ là. Ngoài ra, các chỉ số luồng đầu vào, chẳng hạn như số nhận dạng máy ảnh thường không được bao gồm dưới dạng thứ nguyên trong trường tiếp nhận.


3

Tôi hy vọng minh họa này sẽ giúp bạn:

(Các) trường tiếp nhận : là một phần nhỏ của đầu vào để chỉ tạo một nút trong bản đồ đặc trưng .

(Các) bản đồ tính năng : là đầu ra của quá trình tích chập, có thể nói bản đồ tính năng như là một đại diện tính năng của đầu vào của bộ lọc. Một bản đồ tính năng bao gồm nhiều đầu ra của bộ lọc (từ các trường tiếp nhận khác nhau) từ một hạt nhân. Số lượng bản đồ tính năng phụ thuộc vào số lượng hạt nhân.

Vì vậy, ngay cả bản đồ tính năng là đầu vào của bộ lọc tiếp theo, nhưng các trường tiếp nhận tiếp theo không phải là bản đồ tính năng. Trường tiếp nhận tiếp theo bao gồm một nút phần nhỏ từ các bản đồ tính năng khác nhau (không chỉ một bản đồ tính năng).

Ngoài ra, chúng ta có thể thấy từ hình minh họa ở trên, một bản đồ đặc trưng có kích thước hai chiều (46×46), sau đó một kích thước trường tiếp nhận sẽ luôn luôn ba chiều (5×5×Số lượng bản đồ tính năng).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.