Tôi đã xây dựng một mạng lưới thần kinh nhân tạo trong python bằng cách sử dụng chức năng tối ưu hóa scipy.optizes.minizing (Conjugate gradient).
Tôi đã thực hiện kiểm tra độ dốc, kiểm tra lại mọi thứ, v.v. và tôi khá chắc chắn rằng nó hoạt động chính xác.
Tôi đã chạy nó một vài lần và nó đạt đến 'Tối ưu hóa kết thúc thành công' tuy nhiên khi tôi tăng số lượng các lớp ẩn, chi phí của giả thuyết sẽ tăng (mọi thứ khác được giữ nguyên) sau khi nó kết thúc thành công.
Theo trực giác, nó cảm thấy như thể chi phí sẽ giảm khi số lượng các lớp ẩn tăng lên, vì nó có thể tạo ra một giả thuyết phức tạp hơn có thể phù hợp với dữ liệu tốt hơn, tuy nhiên điều này dường như không phải là trường hợp.
Tôi muốn được hiểu những gì đang diễn ra ở đây, hoặc nếu tôi đã triển khai mạng lưới thần kinh không chính xác?