Trước hết, tôi muốn nói rằng việc thực hiện là một từ đáng ngờ trong bối cảnh của các mạng lưới thần kinh (theo tôi). Tôi đoán bạn đã liệt kê hầu hết các cách tiếp cận, nhưng đây là cách gần đây tôi đã tiếp cận thử nghiệm.
Giải thích đầu tiên là việc thực hiện thực tế trong một số mã nguồn. Trong trường hợp này, tôi nghĩ các cách quan trọng nhất để kiểm tra phần này là:
- Kiểm tra xem các hoạt động cơ bản là chính xác. Đặc biệt là khi sử dụng các phép toán ma trận, bạn có thể đã giám sát đó
*
thực sự là một phép nhân phần tử chứ không phải là một sản phẩm chấm hoặc bạn có các kích thước không khớp.
- Thực hiện kiểm tra độ dốc. Tôi thích làm điều đó cho nhiều dẫn xuất. Nó bắt đầu với đạo hàm của hàm kích hoạt và tổng đạo hàm của hàm trọng số wrt. Nếu có vấn đề ở đó, bạn có thể áp dụng nó cho các đầu vào wrt phái sinh (điều này sẽ là về việc cập nhật sai lệch) hoặc các đầu ra (tổng sai số có trọng số trong lớp tiếp theo)
- Tôi cũng thích tạo ra các nhiệm vụ học tập nhân tạo, tầm thường. Ví dụ, đối với một mạng được kết nối đầy đủ, tôi cho một mạng một lớp tìm hiểu tổng của các đầu vào hoặc bất cứ thứ gì mà tôi biết trọng lượng phải là bao nhiêu. Đối với các mạng nhiều lớp, điều này khó hơn một chút, nhưng bạn có thể làm điều gì đó tương tự mà không mong đợi các trọng số nhất định. Đây thực tế là ý tưởng tương tự như sử dụng một số bộ dữ liệu tham khảo.
Giải thích thứ hai cho việc thực hiện một mạng lưới thần kinh có thể là sự lựa chọn của siêu đường kính. Điều quan trọng nhất của các siêu đường kính này có lẽ là tốc độ học tập. Bạn đã đề cập đến một số kỹ thuật mà trong mắt tôi, thay vì chọn đúng siêu âm.
- Đặt mục tiêu của bạn là một chức năng của các kỷ nguyên cho dữ liệu kiểm tra / hợp lệ / kiểm tra là một cách tốt để biết được liệu mạng của bạn có bị quá mức / thiếu thông tin hay không bằng cách so sánh các lỗi của tàu / kiểm tra / hợp lệ. Trong trường hợp quá mức, bạn có thể giảm số lượng lớp / tế bào thần kinh và trong trường hợp thiếu chất lượng, bạn có thể thêm một số. Nếu bạn dường như không học được gì, điều này có thể là do tỷ lệ học tập quá cao (Cố gắng giảm thiểu chức năng bậc hai với các bước 2, bắt đầu từ 1).
- Nếu bạn bị nổ tung hoặc biến mất độ dốc, có lẽ bạn cần một chức năng kích hoạt khác hoặc một tỷ lệ học tập khác.
Tôi không nghĩ rằng nhìn vào các trọng số là hữu ích. Trong trường hợp CNN, nó giúp cho bạn biết loại hạt nhân nào bạn đang học hoặc nếu bạn thực hiện một số hình thức giảm cân mà bạn thực sự muốn buộc một số trọng lượng về không.
Nó có thể không thêm nhiều vào những gì bạn đã biết và tôi đang quên rất nhiều ở đây, nhưng đây sẽ là câu trả lời của tôi, cho những gì đáng giá ...