Lĩnh vực tiếp nhận
Trường tiếp nhận , trong ngữ cảnh của cơ học CNN, là phạm vi đầu vào riêng biệt được chọn làm đầu vào cho hạt nhân chập của một lớp cụ thể. Phạm vi của một lĩnh vực tiếp nhận là một chức năng của cả vị trí và kích thước. Phạm vi áp dụng cho một hoặc nhiều kích thước. 1
- Ngang
- Theo chiều dọc
- Chỉ số khung
- Tăng thời gian
- Chỉ số lớp pixel
- Kích thước khác
Vị trí của trường tiếp nhận được thay đổi một cách có hệ thống để chọn một tập hợp con của phạm vi các chỉ số trong mỗi thứ nguyên để bao quát toàn bộ phạm vi. 2 Kích thước được khớp với đầu vào của kernel hoạt động theo nó và do đó thường không đổi. 3
Đây là ba đặc điểm xác định của các lĩnh vực tiếp nhận trong CNN.
- Chỉ định phạm vi các chỉ mục được chọn cho đầu vào vào hạt nhân chập về vị trí và kích thước chỉ mục
- Kích thước của phạm vi chỉ mục trong mỗi thứ nguyên (thường là lẻ và nhỏ hơn 20) khớp với các đặc điểm kích thước đầu vào của nhân
- Vị trí của phạm vi chỉ mục trong mỗi thứ nguyên, được thay đổi một cách có hệ thống để bao quát toàn bộ phạm vi thông tin trong tất cả các thứ nguyên, thường được thay đổi theo gia số cố định
Lưu ý rằng thuật ngữ Trường tiếp nhận bắt nguồn từ giới hạn biểu thị tín hiệu của trường thị giác được ghi lại trong các hệ thống sinh học. Trong bối cảnh này, thuật ngữ Lĩnh vực tiếp nhận dùng để chỉ phạm vi hình học có được thông qua các thiết bị hình ảnh hoặc các cơ quan. Giống như một con mắt có thể quét một phong cảnh, việc lựa chọn một vị trí trong toàn bộ trường thông tin xảy ra trong thiết kế CNN.
Điểm chung giữa sinh học và nhân tạo là việc sử dụng thay đổi trọng tâm của sự chú ý trên toàn bộ không gian cảm giác.
Bản đồ tính năng như là một đại diện của các tính năng được trích xuất
Thuật ngữ Bản đồ đặc trưng trong ngữ cảnh này là bản đồ biểu thị các tính năng được trích xuất thông qua một hoặc nhiều lớp tích chập. Thuật ngữ này có thể được sử dụng không chính xác cho đầu ra trung gian của hạt nhân, nhưng lưu ý rằng đầu ra của các lớp trung gian trước các lớp được gộp chung chưa thể hiện trực tiếp các tính năng. Trong các giai đoạn đó, trích xuất không đầy đủ, do đó không có mối quan hệ trực tiếp giữa các giá trị và tính năng.
Thuật ngữ bản đồ tính năng được sử dụng chính xác nhất khi mô tả đầu ra của lớp gộp cuối cùng trong một phần của các lớp CNN. Phần này có thể nằm trong một chuỗi các phần CNN hoặc có thể là các thành phần trong kiến trúc hệ thống lớn hơn.
Ví dụ về ánh xạ tính năng bao gồm những điều này.
- Cạnh
- Xuất hiện hoặc biến mất (miền thời gian)
- Các yếu tố đối tượng
- Quỹ đạo chuyển động
- Thu phóng
- Các đối tượng
- Hành động
Trong cách sử dụng thuật ngữ này, việc ánh xạ các tính năng có liên quan đến kích thước của thông tin, không gian vị trí mà hạt nhân được áp dụng.
Bản đồ đặc trưng như một đại diện của một biến đổi trong không gian Hilbert rời rạc
Khi thuật ngữ Bản đồ đặc trưng được áp dụng cho ánh xạ được hoàn thành bởi một hoặc một nhóm các lớp CNN, các tính năng ở đầu ra được ánh xạ tới đầu vào, không phải cho các vị trí. Trong bối cảnh này, ánh xạ là phép biến đổi tenxơ trong Không gian Hilbert. Lưu ý rằng bản đồ không phải là biểu diễn của tín hiệu mà là biểu diễn của phép biến đổi, hạt nhân và các tham số đã học của nó ở trạng thái hiện tại.
Để phân biệt bối cảnh này với bối cảnh trước đó, có thể hữu ích khi sử dụng thuật ngữ Ánh xạ tính năng để chỉ ra một phép biến đổi tenxơ thay vì đầu ra của phép biến đổi đó.
Chồng chéo các Điều khoản
Khi đầu ra của phần tích chập chứa bản đồ các tính năng và được đưa vào một phần hoặc phần tích chập khác, bản đồ tính năng của một phần sẽ trở thành không gian đầy đủ mà trường tiếp nhận chọn tập hợp thông tin được đưa vào nhân tiếp theo như đầu vào.
Lưu ý rằng bản đồ đặc trưng là tín hiệu hoàn chỉnh đại diện cho tất cả dữ liệu trong phần mạng của nó, trong đó trường nhận thường là một tập hợp con của tín hiệu hoàn chỉnh được áp dụng nhiều lần để bao quát toàn bộ chiều rộng của tín hiệu theo nhiều chiều.
Hai thuật ngữ này không đồng nghĩa trong bất kỳ bối cảnh nào mà chỉ liên quan đến lý thuyết và thực tiễn.
Chú thích
[1] Cả vị trí và kích thước được chỉ định trong mỗi n kích thước trong Tôin, Ở đâu n ≥ 1.
[2] Việc lựa chọn các phạm vi trong mỗi thứ nguyên có thể được thực hiện thông qua việc lặp trong các thuật toán hoặc thông qua các giải pháp phần cứng thực hiện các hoạt động cửa sổ với mạch DSP hoặc GPU, có thể được thực hiện thông qua các hoạt động RISC song song được điều khiển bằng phần cứng hoặc phần sụn.
[3] Các chỉ số ví dụ và kỷ nguyên có thể được giới hạn tương tự trong một số thiết kế CNN, nhưng các chỉ số đó không, theo nghĩa thông thường của thuật ngữ, được coi là một phần của các lĩnh vực tiếp nhận. Chỉ có kích thước trong mỗi ví dụ là. Ngoài ra, các chỉ số luồng đầu vào, chẳng hạn như số nhận dạng máy ảnh thường không được bao gồm dưới dạng thứ nguyên trong trường tiếp nhận.