Điều này là với sự giới thiệu đối với Bản địa hóa đối tượng hiệu quả bằng cách sử dụng Mạng kết hợp và từ những gì tôi hiểu, việc bỏ học được thực hiện trong 2D.
Sau khi đọc mã từ Keras về cách triển khai Dropout Spatial 2D, về cơ bản, mặt nạ nhị phân ngẫu nhiên có hình dạng [batch_size, 1, 1, num_channels] được triển khai. Tuy nhiên, 2D Dropout không gian này chính xác làm gì với khối tích chập đầu vào có hình dạng [batch_size, height, width, num_channels]?
Dự đoán hiện tại của tôi là đối với mỗi pixel, nếu bất kỳ lớp / kênh nào của pixel có giá trị âm, toàn bộ các kênh của một pixel đó sẽ được mặc định là 0. Điều này có đúng không?
Tuy nhiên, nếu dự đoán của tôi là chính xác, thì việc sử dụng mặt nạ nhị phân có hình dạng [batch_size, height, width, num_channels] chính xác theo chiều của khối đầu vào ban đầu sẽ đưa ra thông số phần tử thông thường (điều này là theo Thực hiện bỏ học ban đầu của tenorflow đặt hình dạng của mặt nạ nhị phân là hình dạng của đầu vào)? Bởi vì điều đó có nghĩa là nếu bất kỳ pixel nào trong khối đối lưu là âm, thì toàn bộ khối đối lưu sẽ được mặc định là 0. Đây là phần khó hiểu mà tôi không hiểu lắm.