Đây là một câu hỏi rất hay và bạn cần hiểu điều này để hiểu thêm về học tập sâu.
Về cơ bản, bạn có hình ảnh thô, hãy chụp một hình ảnh. Hình ảnh này có 3 kênh và trong mỗi giá trị pixel của kênh nằm trong khoảng từ 0 đến 255.
Mục tiêu của chúng tôi ở đây là nén phạm vi giá trị cho tất cả các pixel trong ba kênh thành một phạm vi rất nhỏ. Đây là nơi tiền xử lý xuất hiện. Nhưng đừng nghĩ tiền xử lý chỉ liên quan đến các kỹ thuật devtn trung bình và std có nhiều thứ khác như PCA, làm trắng, v.v.
1) Sử dụng giá trị trung bình: Bằng cách tính toán giá trị trung bình, các giá trị pixel màu đỏ đầu tiên trên tất cả các hình ảnh đào tạo sẽ giúp bạn có được giá trị màu đỏ trung bình hiện diện trên tất cả các hình ảnh đào tạo ở vị trí đầu tiên. Tương tự bạn tìm thấy điều này cho tất cả các giá trị kênh màu đỏ, giá trị kênh màu xanh lá cây. Cuối cùng, bạn nhận được một hình ảnh trung bình từ tất cả các hình ảnh đào tạo.
Bây giờ nếu bạn trừ hình ảnh trung bình này khỏi tất cả các hình ảnh đào tạo, bạn rõ ràng biến đổi các giá trị pixel của hình ảnh, hình ảnh không còn có thể hiểu được bằng mắt người, các giá trị pixal hiện nằm trong phạm vi từ dương sang âm trong đó giá trị trung bình nằm ở 0 .
2) Bây giờ nếu bạn một lần nữa chia chúng cho độ lệch chuẩn, về cơ bản bạn sẽ nén phạm vi giá trị pixel trước đó thành một phạm vi nhỏ.
NHƯNG TẠI SAO TẤT CẢ ĐIỀU NÀY? Tôi sẽ nói từ kinh nghiệm của mình rằng thực hiện quá trình tiền xử lý này trên các hình ảnh và sau đó đưa các hình ảnh được chuyển đổi này vào mô hình phân loại sẽ chạy nhanh hơn và tốt hơn. Đó là lý do tại sao.
Khi bạn đang tìm hiểu sâu, hãy xem xét bình thường hóa hàng loạt sau khi bạn hiểu khái niệm chuẩn hóa này