Lấy các công cụ ước tính khả năng tối đa
Giả sử rằng chúng ta có vectơ ngẫu nhiên, mỗi kích thước : trong đó mỗi vectơ ngẫu nhiên có thể được hiểu là một quan sát (điểm dữ liệu) trên các biến . Nếu mỗi là iid như các vectơ Gauss đa biến:mp p X ( i )X( 1 ), X( 2 ), . . . , X( m )pX( tôi )
X( tôi )~ Np( μ , Σ )
Trong đó các tham số không xác định. Để có được ước tính của họ, chúng ta có thể sử dụng phương pháp khả năng tối đa và tối đa hóa chức năng khả năng đăng nhập.μ , Σ
Lưu ý rằng do tính độc lập của các vectơ ngẫu nhiên, mật độ chung của dữ liệu là sản phẩm của mật độ riêng lẻ , đó là . Lấy logarit cho hàm khả năng logΠ m i = 1 f X ( i ) ( x ( i ) ; μ , Σ ){ X( tôi ), tôi = 1 , 2 , . . . , m }Πmi = 1fX( tôi )( x( tôi ); μ , Σ )
l ( μ , Σ | x( tôi ))= nhật kýΠi = 1mfX( tôi )( x( tôi )| μ,Σ)= nhật ký Πi = 1m1( 2 π)p / 2| Σ |1 / 2điểm kinh nghiệm( - 12( x( tôi )- μ )TΣ- 1( x( tôi )- μ ) )= ∑i = 1m( - p2đăng nhập( 2 π) - 12đăng nhập| Σ | - 12( x( tôi )- μ )TΣ- 1( x( tôi )- μ ) )
l ( μ , Σ ; )= - m p2đăng nhập( 2 π) - m2đăng nhập| Σ | - 12Σi = 1m( x( tôi )- μ )TΣ- 1( x( tôi )- μ )
Xuất phátμ^
Để lấy đạo hàm tương ứng với và bằng 0, chúng ta sẽ sử dụng danh tính phép tính ma trận sau:μ
wAA∂wTMột w∂w= 2 A w nếu
không phụ thuộc vào và là đối xứng.wMộtMột
∂∂μl ( μ , Σ | x( tôi ))0μ^= ∑i = 1mΣ- 1( μ - x( tôi ))=0Since Σ is positive definite=mμ−∑i=1mx(i)=1m∑i=1mx(i)=x¯
Mà thường được gọi là vector trung bình mẫu .
Xuất phátΣ^
Xuất phát MLE cho ma trận hiệp phương sai đòi hỏi nhiều công việc hơn và sử dụng các thuộc tính đại số và tính toán tuyến tính sau:
- Dấu vết là bất biến theo hoán vị tuần hoàn của các sản phẩm ma trận:tr[ACB]=tr[CAB]=tr[BCA]
- Vì là vô hướng, chúng ta có thể lấy dấu vết của nó và nhận được cùng một giá trị:x t A x = t r [ x T A x ] = t r [ x t x A ]xTAxxtAx=tr[xTAx]=tr[xtxA]
- ∂∂Atr[AB]=BT
- ∂∂Alog|A|=A−T
Kết hợp các tính chất này cho phép chúng ta tính toán
∂∂AxtAx=∂∂Atr[xTxA]=[xxt]T=xTTxT=xxT
Đó là sản phẩm bên ngoài của vectơ với chính nó.x
Bây giờ chúng ta có thể viết lại hàm khả năng đăng nhập và tính toán wrt phái sinh (lưu ý là hằng số) CΣ−1C
l(μ,Σ|x(i))∂∂Σ−1l(μ,Σ|x(i))=C−m2log|Σ|−12∑i=1m(x(i)−μ)TΣ−1(x(i)−μ)=C+m2log|Σ−1|−12∑i=1mtr[(x(i)−μ)(x(i)−μ)TΣ−1]=m2Σ−12∑i=1m(x(i)−μ)(x(i)−μ)T Since ΣT=Σ
Tương đương với 0 và giải choΣ
0Σ^=mΣ−∑i=1m(x(i)−μ)(x(i)−μ)T=1m∑i=1m(x(i)−μ^)(x(i)−μ^)T
Nguồn