Làm thế nào để lấy đạo hàm của mật độ đa biến thông thường?


35

Nói rằng tôi có mật độ bình thường . Tôi muốn có được wrt phái sinh thứ hai (một phần) . Không chắc chắn làm thế nào để lấy đạo hàm của một ma trận.μN(μ,Σ)μ

Wiki nói lấy phần tử phái sinh theo phần tử bên trong ma trận.

Tôi đang làm việc với xấp xỉ Laplace Chế độ là .Θ = μ

logPN(θ)=logPN12(θθ^)TΣ1(θθ^).

θ^=μ

Tôi đã được cung cấp làm thế nào điều này xảy ra?

Σ1=2θ2logp(θ^|y),

Những gì tôi đã làm:

logP(θ|y)=k2log2π12log|Σ|12(θθ^)TΣ1(θθ^)

Vì vậy, tôi lấy wrt phái sinh cho , trước hết, có một chuyển vị, thứ hai, nó là một ma trận. Vì vậy, tôi bị mắc kẹt.θ

Lưu ý: Nếu giáo sư của tôi bắt gặp điều này, tôi đang đề cập đến bài giảng.


1
một phần của vấn đề của bạn có thể là biểu hiện của bạn đối với khả năng đăng nhập có lỗi - bạn cónơi bạn nên có . Ngoài ra, bất kỳ cơ hội nào bạn có nghĩa là ? |Σ|log(|Σ|)Σ1=2θ2logp(θ|y)
Macro

Vâng, bạn đúng, xin lỗi. Tại sao có dấu âm ở phía trước đạo hàm riêng?
dùng1061210

Tôi chỉ làm rõ về dấu hiệu tiêu cực bởi vì, đạo hàm thứ hai âm là thông tin đánh bắt được quan sát, thường được quan tâm. Ngoài ra, theo tính toán của riêng tôi, tôi thấy rằng 2θ2logp(θ|y)=Σ1
Macro

Vì vậy, các thủ tục chung cho chức năng rời rạc / liên tục là gì? Hãy đăng nhập, ghi ở dạng khai triển Taylor, phân biệt hai lần wrt . Thông tin của Fisher nói chung không đúng với hầu hết các mật độ khác, phải không? θ
dùng1061210

3
@user Như tôi đã chỉ ra, đạo hàm thứ hai của logarit phải có giá trị riêng không dương. Có, có mối liên hệ giữa phương sai và đạo hàm riêng thứ hai âm, như lý thuyết về ước tính khả năng tối đa, thông tin của Fisher, v.v., cho thấy - Macro đã đề cập đến điều đó sớm hơn trong các bình luận này.
whuber

Câu trả lời:


66

Trong chương 2 của Matrix Cookbook, có một đánh giá tốt về các công cụ tính toán ma trận cung cấp nhiều danh tính hữu ích giúp giải quyết các vấn đề mà người ta sẽ gặp phải khi thực hiện xác suất và thống kê, bao gồm các quy tắc để giúp phân biệt khả năng Gaussian đa biến.

Nếu bạn có một véc tơ ngẫu nhiên có nghĩa là đa biến bình thường với vector trung bình μ và phương sai ma trận Σ , sau đó sử dụng phương trình (86) trong sách dạy nấu ăn ma trận để thấy rằng gradient của log likelihood L đối với μyμΣLμ

Lμ=12((yμ)Σ1(yμ)μ)=12(2Σ1(yμ))=Σ1(yμ)

Tôi sẽ để lại nó cho bạn để phân biệt này một lần nữa và tìm câu trả lời cho được .Σ1

Là "tín dụng bổ sung", sử dụng các phương trình (57) và (61) để thấy rằng độ dốc đối với Σ

LΣ=12(log(|Σ|)Σ+(yμ)Σ1(yμ)Σ)=12(Σ1Σ1(yμ)(yμ)Σ1)

Tôi đã bỏ qua rất nhiều bước, nhưng tôi đã tạo ra dẫn xuất này chỉ bằng cách sử dụng các danh tính được tìm thấy trong sách dạy nấu ăn ma trận, vì vậy tôi sẽ để lại cho bạn để điền vào các khoảng trống.

Tôi đã sử dụng các phương trình điểm số này để ước tính khả năng tối đa, vì vậy tôi biết chúng là chính xác :)


4
Tài liệu tham khảo tuyệt vời - sẽ tự giới thiệu nó. Không phải là một tài liệu tham khảo sư phạm tốt cho một người không biết đại số ma trận. Thách thức thực sự xuất phát từ thực tế làm việc ra . Một nỗi đau thực sự. Σ
xác suất

3
Một nguồn tốt khác về tính toán ma trận là Magnus & Neudecker, amazon.com/ từ
StasK

2
Số tham chiếu của phương trình đã được thay đổi (có thể do một phiên bản mới). Phương trình tham chiếu mới là 86.
goelakash 17/05/2016

2
Tôi có thể rời khỏi đây nhưng tôi không nghĩ rằng công thức này là chính xác. Tôi đã sử dụng điều này với các ví dụ thực tế và xem xét sự khác biệt hữu hạn của chúng. Có vẻ như công thức cho cho các giá trị chính xác cho các mục chéo. Tuy nhiên, các mục ngoài đường chéo là một nửa của những gì họ nên được. LΣ
jjet

5

Bạn cần đảm bảo rằng bạn chăm sóc đúng cách các yếu tố lặp lại trong , nếu không, các dẫn xuất của bạn sẽ không chính xác. Ví dụ, (141) Matrix Cookbook cho một đối xứng Σ đạo hàm sauΣΣ

log|Σ|Σ=2Σ1(Σ1I)

(14) của Cách phân biệt chức năng của hiệp phương sai ma trận cho

trace(Σ1xx)Σ=2Σ1xxΣ1+(Σ1xxΣ1I)

nơi biểu thị sản phẩm Hadmard và để thuận tiện chúng tôi đã xác định x : = y - μ .x:=yμ

Lưu ý đặc biệt này là không giống như khi symmetricity của không áp đặt. Kết quả là chúng ta có điều đóΣ

LΣ=Σ12(Dlog|2π|+log|Σ|+xΣ1x))=Σ12(log|Σ|+trace(Σ1xx))=12(2Σ1(Σ1I)2Σ1xxΣ1+(Σ1xxΣ1I))

DxyμDlog|2π|

i,jthLΣLΣij


0

Tôi đã cố gắng xác minh tính toán câu trả lời của @ Macro nhưng tìm thấy lỗi dường như là một lỗi nhỏ trong giải pháp hiệp phương sai. Anh ấy đã thu được

LΣ=12(Σ1Σ1(yμ)(yμ)Σ1)=A
However, it appears that the correct solution is actually
B=2Adiag(A)
The following R script provides a simple example in which the finite difference is calculated for each element of Σ. It demonstrates that A provides the correct answer only for diagonal elements while B is correct for every entry.
library(mvtnorm)

set.seed(1)

# Generate some parameters
p <- 4
mu <- rnorm(p)
Sigma <- rWishart(1, p, diag(p))[, , 1]

# Generate an observation from the distribution as a reference point
x <- rmvnorm(1, mu, Sigma)[1, ]

# Calculate the density at x
f <- dmvnorm(x, mu, Sigma)

# Choose a sufficiently small step-size
h <- .00001

# Calculate the density at x at each shifted Sigma_ij
f.shift <- matrix(NA, p, p)
for(i in 1:p) {
  for(j in 1:p) {
    zero.one.mat <- matrix(0, p, p)
    zero.one.mat[i, j] <- 1
    zero.one.mat[j, i] <- 1

    Sigma.shift <- Sigma + h * zero.one.mat
    f.shift[i, j] <- dmvnorm(x, mu, Sigma.shift)
  }
}

# Caluclate the finite difference at each shifted Sigma_ij
fin.diff <- (f.shift - f) / h

# Calculate the solution proposed by @Macro and the true solution
A <- -1/2 * (solve(Sigma) - solve(Sigma) %*% (x - mu) %*% t(x - mu) %*% solve(Sigma))
B <- 2 * A - diag(diag(A))

# Verify that the true solution is approximately equal to the finite difference
fin.diff
A * f
B * f

Cảm ơn bình luận của bạn. Tôi tin rằng bạn diễn giải ký hiệu khác với mọi người khác, bởi vì bạn đồng thời thay đổi các cặp yếu tố khớp chéo củaΣ, do đó nhân đôi hiệu quả của sự thay đổi. Trong thực tế, bạn đang tính toán bội số của một đạo hàm định hướng. Dường như có một vấn đề nhỏ với giải pháp của Macro trong trường hợp phải chuyển đổi - nhưng điều đó sẽ không thay đổi gì trong ứng dụng thành ma trận đối xứng.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.