Dropout không thực sự loại bỏ tế bào thần kinh, chỉ là những tế bào thần kinh cụ thể đó không đóng vai trò gì (không được kích hoạt) cho lô dữ liệu nhất định.
Ví dụ - Giả sử có đường có 8 làn - Khi Xe tải đến, họ đi qua làn 1,2,4,6,7, khi Ô tô đến, họ đi qua làn 2,3,4,7,8 và khi Xe đạp đến , họ đi qua làn đường 1,2,5,8. Vì vậy, bất kể phương tiện nào, tất cả các làn đường đều ở đó, nhưng chỉ một số trong số chúng được sử dụng.
Tương tự, tất cả các nơ-ron được sử dụng trong toàn bộ mô hình, nhưng chỉ một tập hợp các nơ-ron được kích hoạt cho một lô dữ liệu cụ thể. Và mô hình không bị cắt giảm sau đó, độ phức tạp của mô hình vẫn như cũ.
Tại sao nên sử dụng bỏ học?
Như được đưa ra trong cuốn sách Deep learning của Ian Goodfellow,
bỏ học có hiệu quả hơn so với các bộ chuẩn hóa tính toán rẻ tiền tiêu chuẩn khác, chẳng hạn như phân rã trọng lượng, các ràng buộc định mức của bộ lọc và chính quy hóa hoạt động thưa thớt.
Anh cũng nói-
Một lợi thế của việc bỏ học là nó rất rẻ.
Một lợi thế đáng kể khác của việc bỏ học là nó không giới hạn đáng kể loại mô hình hoặc quy trình đào tạo có thể được sử dụng. Nó hoạt động tốt với gần như bất kỳ mô hình nào sử dụng biểu diễn phân tán và có thể được đào tạo với độ dốc dốc ngẫu nhiên. Điều này bao gồm các mạng thần kinh hướng tới, các mô hình xác suất như máy Boltzmann bị hạn chế (Srivastava et al., 2014) và mạng thần kinh tái phát (Bayer và Osendorfer, 2014; Pascanu et al., 2014a).
Cuốn sách này nói-
Ý tưởng cốt lõi là việc đưa ra nhiễu trong các giá trị đầu ra của một lớp có thể phá vỡ các mẫu tình huống không đáng kể, mà mạng sẽ bắt đầu ghi nhớ nếu không có nhiễu.