Tôi đang thực hiện quá trình tiền xử lý dữ liệu và sẽ xây dựng một Convonets trên dữ liệu của mình sau đó.
Câu hỏi của tôi là: Giả sử tôi có tổng số bộ dữ liệu với 100 hình ảnh, tôi đã tính toán trung bình cho mỗi một trong số 100 hình ảnh và sau đó trừ nó khỏi từng hình ảnh, sau đó chia chúng thành tập hợp và xác thực và tôi cũng làm như vậy các bước để xử lý trên một bộ kiểm tra nhất định, nhưng có vẻ như đây không phải là cách chính xác để thực hiện theo liên kết này: http://cs231n.github.io/neural-networks-2/#datapre
" Cạm bẫy thông thường . Một điểm quan trọng cần thực hiện về quá trình tiền xử lý là mọi thống kê tiền xử lý (ví dụ: trung bình dữ liệu) chỉ phải được tính trên dữ liệu huấn luyện, sau đó áp dụng cho dữ liệu kiểm tra / kiểm tra. Ví dụ: tính toán trung bình và trừ nó mỗi hình ảnh trên toàn bộ tập dữ liệu và sau đó phân tách dữ liệu thành các phần tách train / val / test sẽ là một sai lầm. Thay vào đó, giá trị trung bình chỉ được tính trên dữ liệu huấn luyện và sau đó trừ đi tất cả các phần tách (train / val / test). "
Tôi đoán tác giả đang nói gì, không tính trung bình và trừ nó trong mỗi hình ảnh mà tính giá trị trung bình của tổng số hình ảnh (nghĩa là (image1 + ... + image100) / 100) và trừ đi giá trị trung bình mỗi hình ảnh.
Tôi không hiểu ai có thể giải thích? và cũng có thể giải thích tại sao những gì tôi đang làm là sai (nếu nó thực sự sai).