Câu hỏi được gắn thẻ «derivative»

Đối với các câu hỏi về chủ đề liên quan đến khái niệm toán học về đạo hàm, tức là . Đối với các câu hỏi thuần túy toán học về đạo hàm, tốt hơn nên hỏi trên Toán SE https://math.stackexchange.com/ ddxf(x)

6
Backpropagation với Softmax / Cross Entropy
Tôi đang cố gắng hiểu làm thế nào backpropagation hoạt động cho lớp đầu ra softmax / cross-entropy. Hàm lỗi entropy chéo là E(t,o)=−∑jtjlogojE(t,o)=−∑jtjlog⁡ojE(t,o)=-\sum_j t_j \log o_j với và là mục tiêu và đầu ra tại nơron , tương ứng. Tổng là trên mỗi nơ ron trong lớp đầu ra. …






1
Xấp xỉ bậc hai của hàm mất (Sách học sâu, 7.33)
Trong cuốn sách của Goodfellow (2016) về học tập sâu, ông đã nói về sự tương đương của việc dừng sớm với chính quy L2 ( https://www.deeplearningbook.org/contents/THERization.html trang 247). Xấp xỉ bậc hai của hàm chi phí jjj được cho bởi: J^(θ)=J(w∗)+12(w−w∗)TH(w−w∗)J^(θ)=J(w∗)+12(w−w∗)TH(w−w∗)\hat{J}(\theta)=J(w^*)+\frac{1}{2}(w-w^*)^TH(w-w^*) HHHf(w+ϵ)=f(w)+f′(w)⋅ϵ+12f′′(w)⋅ϵ2f(w+ϵ)=f(w)+f′(w)⋅ϵ+12f″(w)⋅ϵ2f(w+\epsilon)=f(w)+f'(w)\cdot\epsilon+\frac{1}{2}f''(w)\cdot\epsilon^2


1
Điều gì biện minh cho tính toán này của đạo hàm của hàm ma trận?
Trong khóa học máy của Andrew Ng, anh sử dụng công thức này: ∇Atr(ABATC)=CAB+CTABT∇Atr(ABATC)=CAB+CTABT\nabla_A tr(ABA^TC) = CAB + C^TAB^T và anh ta làm một bằng chứng nhanh chóng được hiển thị dưới đây: ∇Atr(ABATC)=∇Atr(f(A)ATC)=∇∘tr(f(∘)ATC)+∇∘tr(f(A)∘TC)=(ATC)Tf′(∘)+(∇∘Ttr(f(A)∘TC)T=CTABT+(∇∘Ttr(∘T)Cf(A))T=CTABT+((Cf(A))T)T=CTABT+CAB∇Atr(ABATC)=∇Atr(f(A)ATC)=∇∘tr(f(∘)ATC)+∇∘tr(f(A)∘TC)=(ATC)Tf′(∘)+(∇∘Ttr(f(A)∘TC)T=CTABT+(∇∘Ttr(∘T)Cf(A))T=CTABT+((Cf(A))T)T=CTABT+CAB\nabla_A tr(ABA^TC) \\ = \nabla_A tr(f(A)A^TC) \\ = \nabla_{\circ} tr(f(\circ)A^TC) + \nabla_{\circ}tr(f(A)\circ^T C)\\ =(A^TC)^Tf'(\circ) + (\nabla_{\circ^T}tr(f(A)\circ^T C)^T …



1
Dẫn xuất Gradient và vector: vector hàng hay cột?
Khá nhiều tài liệu tham khảo (bao gồm wikipedia và http://www.atmos.washington.edu/~dennis/MatrixCalculus.pdf và http://michael.orlitzky.com/articles/the_derivative_of_a_quadratic_form.php ) xác định đạo hàm của a hàm bởi một vectơ là đạo hàm riêng của hàm được sắp xếp theo một hàng (vì vậy đạo hàm của hàm có giá trị vô hướng là vectơ hàng). …

2
Đạo hàm của Softmax liên quan đến trọng lượng
Tôi mới học sâu và đang cố gắng tính đạo hàm của hàm sau đối với ma trận ww\mathbf w: p(a)=ew⊤axΣdew⊤dxp(a)=ewa⊤xΣdewd⊤xp(a) = \frac{e^{w_a^\top x}}{\Sigma_{d} e^{w_d^\top x}} Sử dụng quy tắc thương, tôi nhận được: ∂p(a)∂w=xew⊤axΣdew⊤dx−ew⊤axΣdxew⊤dx[Σdew⊤dx]2=0∂p(a)∂w=xewa⊤xΣdewd⊤x−ewa⊤xΣdxewd⊤x[Σdewd⊤x]2=0\frac{\partial p(a)}{\partial w} = \frac{xe^{w_a^\top x}\Sigma_{d} e^{w_d^\top x} - e^{w_a^\top x}\Sigma_{d} xe^{w_d^\top x}}{[\Sigma_{d} e^{w_d^\top x}]^2} = …
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.