Tôi đang cố gắng giải quyết vấn đề đầu tiên của tài liệu khóa học stanford trực tuyến cs224d và tôi gặp một số vấn đề với vấn đề 3A: Khi sử dụng mô hình bỏ qua gram word2vec với chức năng dự đoán softmax và chức năng mất entropy chéo, chúng tôi muốn tính toán độ dốc đối với các vectơ từ dự đoán. Vì vậy, đưa ra chức năng softmax:
và chức năng entropy chéo:
chúng ta cần tính toán
Các bước của tôi như sau:
bây giờ cho là một vectơ nóng và tôi là lớp đúng:
Điều này là chính xác hay nó có thể được đơn giản hóa hơn nữa? Tôi muốn cố gắng đảm bảo rằng tôi đang đi đúng hướng vì các giải pháp đặt vấn đề không được đăng trực tuyến. Cộng với việc nhận các bài tập chính xác là rất quan trọng để có thể thực hiện đúng các bài tập lập trình.
Vui lòng thêm thẻ tự học vào câu hỏi
—
Dawny33
Dấu trừ thứ 2 trong danh tính nhật ký đầu tiên phải là một điểm cộng. Đã cố gắng sửa nó cho bạn nhưng các chỉnh sửa cần ít nhất 6 ký tự: \
—
FatalMojo