Có một sự lạm dụng tinh vi nhưng nặng nề của ký hiệu làm cho nhiều bước khó hiểu. Chúng ta hãy giải quyết vấn đề này bằng cách quay lại các định nghĩa về nhân ma trận, hoán vị, dấu vết và dẫn xuất. Đối với những người muốn bỏ qua các giải thích, chỉ cần chuyển đến phần cuối cùng "Kết hợp tất cả lại" để xem một cuộc biểu tình khắt khe và đơn giản như thế nào.
Ký hiệu và khái niệm
Kích thước
Để biểu thức có ý nghĩa khi A là ma trận m × n , B phải là ma trận (vuông) n × n và C phải là ma trận m × p , trong đó sản phẩm là ma trận m × p . Để lấy dấu vết (mà là tổng hợp của các yếu tố đường chéo, Tr ( X ) = Σ i X i i ), sau đó p = m , làm cho CABA′CAm×nBn×nCm×pm×pTr(X)=∑iXiip=mC một ma trận vuông.
Các dẫn xuất
Ký hiệu " " xuất hiện để chỉ đạo hàm của một biểu thức đối với với Một . Thông thường, sự khác biệt là một hoạt động thực hiện trên chức năng f : R N → R M . Đạo hàm tại một điểm x ∈ R N là một biến đổi tuyến tính D f ( x ) : R N → R M . Khi chọn các cơ sở cho các không gian vectơ này, một phép biến đổi như vậy có thể được biểu diễn dưới dạng ma trận M × N. Đó không phải là trường hợp tại đây!∇AAf:RN→RMx∈RNDf(x):RN→RMM×N
Ma trận như vectơ
Thay vào đó, đang được coi là một phần tử của R m n : các hệ số của nó đang không được kiểm soát (thường là theo từng hàng hoặc từng cột theo cột) thành một vectơ có độ dài N = m n . Chức năng f ( A ) = Tr ( A B A ' C ) có giá trị thực, đâu M = 1 . Do đó, D f ( x ) phải là ma trận 1 × m n : đó là một vectơ hàng đại diện cho một dạng tuyến tính trênARmnN=mnf(A)=Tr(ABA′C)M=1Df(x)1×mn . Tuy nhiên, các tính toán trong câu hỏi sử dụng mộtcáchkhácđể biểu diễn các dạng tuyến tính: các hệ số của chúng được cuộn lại thànhma trậnm×n.Rmnm×n
Dấu vết dưới dạng tuyến tính
Hãy là một hằng số m × n ma trận. Sau đó, theo định nghĩa của dấu vết và nhân ma trận,ωm×n
Tr(Aω′)=∑i=1m(Aω′)ii=∑i=1m(∑j=1nAij(ω′)ji)=∑i,jωijAij
Điều này thể hiện sự kết hợp tuyến tính có thể nói chung hầu hết các hệ số : ω là một ma trận của hình dạng giống như một và hệ số của nó trong hàng i và cột j là hệ số của A i j trong sự kết hợp tuyến tính. Bởi vì ω i j Một i j = A i j ω i j , vai trò của ω và A có thể chuyển, đưa ra các biểu thức tương đươngAωAijAijωijAij=AijωijωA
∑i,jωijAij=Tr(Aω′)=Tr(ωA′).(1)
ωA→Tr(Aω′)A→Tr(ωA′)m×nm×nRnRm
Tính toán một công cụ phái sinh
Định nghĩa
fxL
f(x+h)−f(x)=Lh+o(|h|)
h∈RNf(x+h)−f(x)Lhhh|h|2
Tính toán
h
f(A+h)−f(A)=Tr((A+h)B(A+h)′C)−Tr(ABA′C)=Tr(hBA′C)+Tr(ABh′C)+o(|h|).(2)
L=Df(A)(1)ω=BA′CTr(Xh′C)X=AB
Tr(Xh′C)=∑i=1m∑j=1n∑k=1mXijhkjCki=∑i,j,khkj(CkiXij)=Tr((CX)h′).(3)
X=AB(2)
f(A+h)−f(A)=Tr(hBA′C)+Tr(CABh′)+o(|h|).
fA
Df(A)=(BA′C)′+CAB=C′AB′+CAB,
ω(1)
Để tất cả chúng cùng nhau
Ở đây, sau đó, là một giải pháp hoàn chỉnh.
Am×nBn×nCm×mf(A)=Tr(ABA′C)hm×n(3)
f(A+h)−f(A)=Tr(hBA′C)+Tr(ABh′C)+o(|h|)=Tr(h(C′AB′)′+(CAB)h′)+o(|h|),
fC′AB′+CAB.
Bởi vì việc này chỉ mất khoảng một nửa công việc và chỉ liên quan đến các thao tác cơ bản nhất của ma trận và dấu vết (nhân và hoán vị), nên nó được coi là một minh chứng đơn giản hơn - và dễ thấy hơn - cho kết quả. Nếu bạn thực sự muốn hiểu các bước riêng lẻ trong bản trình diễn ban đầu, bạn có thể thấy hiệu quả khi so sánh chúng với các tính toán được hiển thị ở đây.