Tôi có một nắm bắt tốt về mạng lưới thần kinh, lan truyền ngược và quy tắc chuỗi tuy nhiên tôi đang đấu tranh để hiểu sự khác biệt tự động.
Dưới đây đề cập đến sự khác biệt tự động bên ngoài bối cảnh lan truyền trở lại:
- Làm thế nào để phân biệt tự động tính toán độ dốc từ một ma trận?
- Các yêu cầu để tính toán một gradient là gì? Có một chức năng cần phải được chỉ định?
- Một số trường hợp sử dụng cho điều này (khác sau đó lan truyền trở lại) là gì?
- Tại sao nó quan trọng và các lựa chọn thay thế là gì?
Tui bỏ lỡ điều gì vậy?
tf.gradient
phương pháp tôi nên xem xét?