Câu hỏi ban đầu là về triển khai TensorFlow cụ thể. Tuy nhiên, câu trả lời dành cho việc triển khai nói chung. Câu trả lời chung này cũng là câu trả lời chính xác cho TensorFlow.
Khi sử dụng chuẩn hóa hàng loạt và bỏ qua trong TensorFlow (cụ thể là sử dụng Contrib.layers), tôi có cần lo lắng về thứ tự không?
Có vẻ như nếu tôi sử dụng tính năng bỏ qua ngay sau khi chuẩn hóa hàng loạt thì có thể sẽ gặp sự cố. Ví dụ: nếu sự thay đổi trong quá trình chuẩn hóa theo lô huấn luyện đến số lượng quy mô lớn hơn của đầu ra đào tạo, nhưng sau đó sự thay đổi đó được áp dụng cho số quy mô nhỏ hơn (do sự bù đắp cho việc có nhiều đầu ra hơn) mà không bị bỏ dở trong quá trình thử nghiệm, thì ca có thể bị tắt. Lớp chuẩn hóa hàng loạt TensorFlow có tự động bù đắp điều này không? Hay điều này không xảy ra vì một lý do nào đó mà tôi mất tích?
Ngoài ra, có những cạm bẫy nào khác cần chú ý khi sử dụng hai thứ này cùng nhau không? Ví dụ, giả sử tôi đang sử dụng chúng theo thứ tự đúng trong trường hợp các bên trên (giả sử có là một trật tự chính xác), có thể có rắc rối với việc sử dụng cả hai bình thường hàng loạt và bỏ học trên nhiều lớp liên tiếp? Tôi không thấy vấn đề đó ngay lập tức, nhưng tôi có thể thiếu một cái gì đó.
Cảm ơn bạn rất nhiều!
CẬP NHẬT:
Một thử nghiệm thực nghiệm dường như cho thấy rằng việc đặt hàng có ý nghĩa. Tôi đã chạy cùng một mạng hai lần chỉ với định mức hàng loạt và đảo ngược thời gian bỏ học. Khi người bỏ học trước định mức lô, mất xác thực dường như sẽ tăng lên vì mất đào tạo đang giảm xuống. Cả hai đều đi xuống trong trường hợp khác. Nhưng trong trường hợp của tôi, các chuyển động chậm, vì vậy mọi thứ có thể thay đổi sau khi tập luyện nhiều hơn và đó chỉ là một bài kiểm tra duy nhất. Một câu trả lời dứt khoát và đầy đủ thông tin hơn sẽ vẫn được đánh giá cao.