Các tính năng nút cổ chai là gì?


11

Trong bài đăng trên blog Xây dựng các mô hình phân loại hình ảnh mạnh mẽ bằng cách sử dụng rất ít dữ liệu , các tính năng thắt cổ chai được đề cập. Các tính năng nút cổ chai là gì? Họ có thay đổi với kiến ​​trúc được sử dụng không? Chúng có phải là đầu ra cuối cùng của các lớp chập trước khi lớp được kết nối đầy đủ không? Tại sao họ được gọi như vậy?


Câu trả lời:


9

Trong bài đăng trên blog Xây dựng các mô hình phân loại hình ảnh mạnh mẽ bằng cách sử dụng rất ít dữ liệu , các tính năng thắt cổ chai được đề cập. Các tính năng nút cổ chai là gì?

Nó được viết rõ ràng trong liên kết mà bạn đã đưa ra "các tính năng thắt cổ chai" từ mô hình VGG16: bản đồ kích hoạt cuối cùng trước các lớp được kết nối đầy đủ .

Họ có thay đổi với kiến ​​trúc được sử dụng không?

Chắc chắn rồi. Tác giả rất có thể đã sử dụng một mô hình được đào tạo trước (được đào tạo trên một dữ liệu lớn và hiện chỉ được sử dụng như một trình trích xuất tính năng)

Chúng có phải là đầu ra cuối cùng của các lớp chập trước khi lớp được kết nối đầy đủ không?

Đúng.

Tại sao họ được gọi như vậy?

Với kích thước đầu vào cho VGG, các bản đồ đặc trưng của kích thước HxW sẽ nhỏ hơn hai lần sau mỗi hoạt động nhóm tối đa. HxW là nhỏ nhất trên lớp chập cuối cùng.


6

Đầu tiên, chúng ta cần nói về học chuyển. Hãy tưởng tượng bạn đã đào tạo một mạng lưới nơ-ron qua bộ dữ liệu hình ảnh để phát hiện mèo, bạn có thể sử dụng một phần của khóa đào tạo bạn đã thực hiện để làm việc khác phát hiện ra thứ khác. Điều đó được gọi là học chuyển.

Để thực hiện chuyển đổi học tập, bạn sẽ loại bỏ lớp được kết nối đầy đủ cuối cùng khỏi mô hình và cắm các lớp của bạn ở đó. Đầu ra mô hình "cắt ngắn" sẽ là các tính năng sẽ lấp đầy "mô hình" của bạn. Đó là những tính năng thắt cổ chai.

VGG16 là một mô hình tiền xử lý trên danh mục ImageNet có độ chính xác rất tốt. Trong bài đăng bạn đã chia sẻ, đang sử dụng mô hình đó làm cơ sở để phát hiện chó mèo với độ chính xác cao hơn.

Các tính năng nút cổ chai phụ thuộc vào mô hình. Trong trường hợp này, chúng tôi đang sử dụng VGG16. Có những mô hình được đào tạo trước khác như VGG19, ResNet-50

Giống như bạn đang cắt một mô hình và thêm các lớp của riêng bạn. Chủ yếu, lớp đầu ra để quyết định những gì bạn muốn phát hiện, đầu ra cuối cùng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.