Làm thế nào để tìm ước tính khả năng tối đa của một tham số nguyên?


7

Câu hỏi CTNH :

x1,x2,,xn là các biến Gaussian độc lập với trung bình và variance . Xác định trong đó không xác định. Chúng tôi quan tâm đến việc ước tính từ .μσ2y=n=1NxnNNy

a. Cho xác định độ lệch và phương sai của nó.N^1=y/μ

b. Cho xác định độ lệch và phương sai của nó.N^2=y2/σ2

Bỏ qua yêu cầu cho là một số nguyênN

c. Có một công cụ ước tính hiệu quả (nhìn vào cả và ) không?μ=0μ0

d. Tìm ước tính khả năng tối đa của từ .Ny

e. Tìm CRLB của từ .Ny

f. Có phải lỗi bình phương trung bình của các công cụ ước tính đạt CRLB khi không?N^1,N^2N

nhập mô tả hình ảnh ở đây

Nếu bất cứ ai có thể hướng tôi đến giải pháp của vấn đề sau đây thì thật tuyệt.

Cảm ơn,

Nadav


Phân phối củaY=iXi?
BruceET

Nó không nói. Tôi cho rằng nó cũng sẽ được phân phối dưới dạng biến Gaussian vì đó là tổng của các biến Gaussian
Nadav Talmon

1
Nếu bình thường, thì và là bình thường. Ý nghĩa và phương sai của Điều đó sẽ kết thúc vấn đề. // Trong thực tế, tôi cho rằng nó có ý nghĩa làm tròn thành một số nguyên. Điều đó có thể làm cho một sự khác biệt nhỏ trong trung bình và phương sai. Bạn có thể tìm ra bao nhiêu sự khác biệt bằng cách mô phỏng. XiY=IXiN^=Y/μN^?N^
BruceET

Không phải sẽ là ? Logic tương tự cho trung bìnhVar(Nestimated)Var(y)/μ
Nadav Talmon

2
Bởi vì Nlà tích phân, bạn không thể (trực tiếp) sử dụng Giải tích để tìm mức tối thiểu. Nếu đây là trở ngại của bạn, thì vui lòng trình bày công việc của bạn trong câu hỏi của bạn để chúng tôi có thể tập trung vào nơi bạn thực sự cần giúp đỡ.
whuber

Câu trả lời:


11

Bạn đã bắt đầu tốt bằng cách viết ra một biểu thức cho khả năng. Nó đơn giản hơn để nhận ra rằngY, là tổng của N độc lập bình thường(μ,σ2) các biến, có phân phối chuẩn với trung bình Nμ và phương sai Nσ2, khả năng của nó là

L(y,N)=12πNσ2exp((yNμ)22Nσ2).

Hãy làm việc với logarit tiêu cực của nó Λ=logL, có cực tiểu tương ứng với cực đại của khả năng:

2Λ(N)=log(2π)+log(σ2)+log(N)+(yNμ)2Nσ2.

Chúng ta cần tìm tất cả các số làm giảm thiểu biểu thức này. Giả vờ một lúc màNcó thể là bất kỳ số thực dương. Như vậy,2Λ là một chức năng khác biệt liên tục của N với đạo hàm

ddN2Λ(N)=1N(yNμ)2σ2N22μ(yNμ)Nσ2.

Đánh số này bằng 0 để tìm các điểm tới hạn, xóa mẫu số và làm một số đại số để đơn giản hóa kết quả, cho

(1)μ2N2+σ2Ny2=0

với một giải pháp tích cực duy nhất (khi μ0)

N^=12μ2(σ2+σ4+4μ2y2).

Thật đơn giản để kiểm tra xem N cách tiếp cận 0 hoặc lớn lên, 2Λ(N) phát triển lớn, vì vậy chúng tôi biết không có tối thiểu toàn cầu gần N0 cũng không gần N. Điều đó chỉ để lại một điểm quan trọng mà chúng tôi tìm thấy, do đó phải là mức tối thiểu toàn cầu. Hơn thế nữa,2Λ phải giảm như N^được tiếp cận từ bên dưới hoặc bên trên. Như vậy

Cực tiểu toàn cầu của Λ phải nằm trong số hai số nguyên ở hai bên của N^.

Điều này đưa ra một quy trình hiệu quả để tìm công cụ ước tính Khả năng tối đa: đó là sàn hoặc trần củaN^(hoặc, đôi khi, cả hai !), nên tính toánN^ và chỉ cần chọn số nguyên nào trong số này 2Λ nhỏ nhất

Hãy tạm dừng để kiểm tra xem kết quả này có ý nghĩa không. Trong hai tình huống có một giải pháp trực quan:

  1. Khi nào μ lớn hơn nhiều σ, Y sẽ gần μ, từ đâu ước tính N đơn giản là |Y/μ|. Trong những trường hợp như vậy, chúng tôi có thể ước chừng MLE bằng cách bỏ qua σ2, cho (như mong đợi)

    N^=12μ2(σ2+σ4+4μ2y2)12μ24μ2y2=|yμ|.

  2. Khi nào σ lớn hơn nhiều μ, Ycó thể được lan truyền khắp nơi, nhưng trung bình Y2 nên gần σ2, ước tính trực quan của N đơn giản là y2/σ2. Thật vậy, bỏ bê μ trong phương trình (1) đưa ra giải pháp mong đợi

    N^y2σ2.

Trong cả hai trường hợp, MLE phù hợp với trực giác, cho thấy chúng ta có thể đã giải quyết nó một cách chính xác. Các tình huống thú vị , sau đó, xảy ra khiμσcó kích thước tương đương. Trực giác có thể giúp đỡ rất ít ở đây.


Để khám phá điều này hơn nữa, tôi đã mô phỏng ba tình huống trong đóσ/μ1/3, 1, hoặc là 3. Nó không quan trọng μ là (miễn là nó khác không), vì vậy tôi đã lấy μ=1. Trong mỗi tình huống tôi tạo ra một cách ngẫu nhiên Y cho các trường hợp N=2,4,8,16, làm điều này một cách độc lập năm ngàn lần.

Những biểu đồ này tóm tắt các MLE của N. Các đường thẳng đứng đánh dấu các giá trị thực củaN.

Nhân vật

Trung bình, MLE dường như là đúng. Khi nàoσlà tương đối nhỏ, MLE có xu hướng chính xác: đó là những gì biểu đồ hẹp ở hàng trên cùng chỉ ra. Khi nàoσ|μ|,MLE không chắc chắn. Khi nàoσ|μ|, MLE thường có thể là N^=1 và đôi khi có thể vài lần N (đặc biệt là khi Nnhỏ). Những quan sát này phù hợp với những gì đã được dự đoán trong phân tích trực quan trước đó.


Chìa khóa để mô phỏng là thực hiện MLE. Nó đòi hỏi phải giải quyết(1) cũng như đánh giá Λ cho các giá trị đã cho Y, μ,σ. Ý tưởng mới duy nhất được phản ánh ở đây là kiểm tra các số nguyên ở hai bên của N^. Hai dòng cuối cùng của hàm fthực hiện phép tính này, với sự giúp đỡ của lambdaviệc đánh giá khả năng đăng nhập.

lambda <- Vectorize(function(y, N, mu, sigma) {
  (log(N) + (y-mu*N)^2 / (N * sigma^2))/2
}, "N") # The negative log likelihood (without additive constant terms)

f <- function(y, mu, sigma) {
  if (mu==0) {
    N.hat <- y^2 / sigma^2
  } else {
    N.hat <- (sqrt(sigma^4 + 4*mu^2*y^2) - sigma^2) / (2*mu^2)
  }
  N.hat <- c(floor(N.hat), ceiling(N.hat))
  q <- lambda(y, N.hat, mu, sigma)
  N.hat[which.min(q)]
} # The ML estimator

1
Tôi không thể yêu cầu một lời giải thích tốt hơn. Cảm ơn bạn rất nhiều, bạn thực sự bao gồm tất cả mọi thứ!
Nadav Talmon

bây giờ tôi cần biết liệu một công cụ ước tính hiệu quả có tồn tại hay không (cho μ!=0μ=0). Tôi biết rằng nếu một công cụ ước tính không thiên vị và trả lời CRLB hơn hiệu quả của nó. Tôi biết nó không thiên vị, nhưng lấy đạo hàm thứ hai của hàm L dường như không đưa tôi đến đâu.
Nadav Talmon

Bỏ qua thực tế rằng Nlà tích phân: nghĩa là cho phép ước tính là mức tối thiểu toàn cầu của hàm khả năng ghi nhật ký âm. Đi từ đó
whuber

Tôi đã lấy đạo hàm của hàm khả năng ghi nhật ký âm như bạn đề xuất và đã cố gắng để có được biểu thức sau: C(N)×(g(y)N) Tôi quản lý để làm điều đó trên μ=0 nhưng không phải trên μ!=0 đây là lý do tại sao chúng tôi đã có một giải pháp tích cực độc đáo trên μ!=0?
Nadav Talmon

Tôi không nghĩ vậy. Tôi thấy dễ dàng hơn để xác định lại vấn đề theoθ=1/N, bởi vì sau đó đạo hàm của khả năng đăng nhập là một hàm bậc hai của θ.
whuber

5

Phương thức whuber đã sử dụng trong câu trả lời xuất sắc của mình là một "mẹo" tối ưu hóa phổ biến liên quan đến việc mở rộng hàm khả năng để cho phép các giá trị thực củaNvà sau đó sử dụng tính đồng nhất của khả năng ghi nhật ký để chỉ ra rằng giá trị tối đa hóa rời rạc là một trong những giá trị riêng biệt ở hai bên của một tối ưu liên tục. Đây là một phương pháp thường được sử dụng trong các vấn đề MLE rời rạc liên quan đến chức năng khả năng đăng nhập lõm. Giá trị của nó nằm ở thực tế là thường có thể có được biểu thức dạng đóng đơn giản cho tối ưu liên tục.

Để đầy đủ, trong câu trả lời này tôi sẽ chỉ cho bạn một phương pháp thay thế, sử dụng phép tính rời rạc bằng cách sử dụng toán tử chênh lệch chuyển tiếp . Hàm khả năng đăng nhập cho vấn đề này là hàm rời rạc:

y(N)=12[ln(2π)+ln(σ2)+ln(N)+(yNμ)2Nσ2]for NN.

Sự khác biệt chuyển tiếp đầu tiên của khả năng đăng nhập là:

Δy(N)=12[ln(N+1)ln(N)+(yNμμ)2(N+1)σ2(yNμ)2Nσ2]=12[ln(N+1N)+N(yNμμ)2(N+1)(yNμ)2N(N+1)σ2]=12[ln(N+1N)+[N(yNμ)22N(yNμ)μ+Nμ2][N(yNμ)2+(yNμ)2]N(N+1)σ2]=12[ln(N+1N)(y+Nμ)(yNμ)Nμ2N(N+1)σ2].

Với một chút đại số, sự khác biệt về phía trước thứ hai có thể được hiển thị là:

Δ2y(N)=12[ln(N+2N)+2N(N+1)μ2+2(y+Nμ)(yNμ)N(N+1)(N+2)σ2]<0.

Điều này cho thấy hàm khả năng đăng nhập là lõm, vì vậy điểm tối đa hóa nhỏ nhất của nó N^ sẽ là:

N^=min{NN|Δy(N)0}=min{NN|ln(N+1N)(y+Nμ)(yNμ)Nμ2N(N+1)σ2}.

(Giá trị tiếp theo cũng sẽ là điểm tối đa hóa khi và chỉ khi Δy(N^)=0.) MLE (nhỏ nhất hoặc toàn bộ) có thể được lập trình như một hàm thông qua một whilevòng lặp đơn giản và điều này sẽ có thể cung cấp cho bạn giải pháp khá nhanh. Tôi sẽ rời khỏi phần lập trình như một bài tập.


Tôi đánh giá cao thời gian của bạn và giải thích kỹ lưỡng. Cảm ơn bạn @Ben!
Nadav Talmon

1

Nhận xét: Đây là một mô phỏng ngắn gọn trong R choμ=50,σ=3, phải chính xác đến 2 hoặc ba nơi, xấp xỉ giá trị trung bình và SD của Y. Bạn sẽ có thể tìm thấy E(Y)Var(Y) bằng các phương pháp phân tích cơ bản như đã nêu trong Nhận xét trước đó của tôi. Nếu chúng ta cóN=100 sau đó E(N^) dường như không thiên vị cho N.

N = 100;  mu = 50;  sg = 3
y = replicate( 10^6, sum(rnorm(N, mu, sg))/mu )
mean(y);  sd(y)
[1] 99.99997
[1] 0.6001208
N.est = round(y);  mean(N.est);  sd(N.est)
[1] 99.9998
[1] 0.6649131

Cảm ơn Bruce!
Nadav Talmon

Tôi có thể hỏi thêm một câu nữa không? Bây giờ tôi được hỏi nếu có một công cụ ước tính hiệu quả liên quan đến những gì tôi tìm thấy, nó cũng nói rằng bây giờ chúng ta bỏ qua yêu cầu cho N là một số nguyên. điều đó có nghĩa là nó không còn là số nguyên nữa? Làm thế nào tôi có thể tìm thấy Khả năng đăng nhập cho trường hợp như vậy?
Nadav Talmon

1
Nếu bạn muốn hiểu về khả năng thiên vị, đừng sử dụng lớn N: thử một giá trị nhỏ N=1đặc biệt thú vị :-). Trường hợp cũng vậyμ=0.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.