MLE có yêu cầu dữ liệu iid không? Hay chỉ là tham số độc lập?


16

Ước tính các tham số sử dụng ước tính khả năng tối đa (MLE) liên quan đến việc đánh giá hàm khả năng, ánh xạ xác suất của mẫu (X) xảy ra với các giá trị (x) trên không gian tham số () được cung cấp một họ phân phối (P (X = x | ) trên các giá trị có thể của θ (lưu ý: tôi có đúng về điều này không?). Tất cả các ví dụ tôi đã thấy liên quan đến việc tính P (X = x | θ) bằng cách lấy sản phẩm của F (X) trong đó F là phân phối với cục bộ giá trị cho và X là mẫu (một vectơ).

Vì chúng ta chỉ nhân dữ liệu, nên dữ liệu có độc lập không? Ví dụ: chúng ta không thể sử dụng MLE để phù hợp với dữ liệu chuỗi thời gian? Hay các tham số chỉ phải độc lập?

Câu trả lời:


14

Hàm likelihood được định nghĩa là xác suất của một sự kiện E (dữ liệu đặt x ) là một hàm của các thông số mô hình θ

L(θ;x)P(Event E;θ)=P(observing x;θ).

Do đó, không có giả định về tính độc lập của các quan sát. Theo cách tiếp cận cổ điển, không có định nghĩa cho sự độc lập của các tham số vì chúng không phải là các biến ngẫu nhiên; một số khái niệm liên quan có thể là nhận dạng , tính trực giao tham số và tính độc lập của Công cụ ước tính khả năng tối đa (là các biến ngẫu nhiên).

Vài ví dụ,

(1). Trường hợp rời rạc . là một mẫu (độc lập) quan sát rời rạc với P ( quan sát  x j ; θ ) > 0 , sau đóx=(x1,...,xn)P(observing xj;θ)>0

L(θ;x)j=1nP(observing xj;θ).

Đặc biệt, nếu , với N đã biết, chúng ta có điều đóxjBinomial(N,θ)N

L(θ;x)j=1nθxj(1θ)Nxj.

(2). Xấp xỉ liên tục . Hãy để là một mẫu từ một liên tục biến ngẫu nhiên X , với phân phối F và mật độ f , với sai số đo ε , đây là, bạn quan sát các bộ ( x j - ε , x j + ϵ ) . Sau đóx=(x1,...,xn)XFfϵ(xjϵ,xj+ϵ)

L(θ;x)j=1nP[observing (xjϵ,xj+ϵ);θ]=j=1n[F(xj+ϵ;θ)F(xjϵ;θ)]

Khi là nhỏ, điều này có thể xấp xỉ (sử dụng Mean Value lý) bởiϵ

L(θ;x)j=1nf(xj;θ)

Đối với một ví dụ với trường hợp bình thường, hãy xem điều này .

(3). Mô hình phụ thuộc và Markov . Giả sử rằng là một tập hợp các quan sát có thể phụ thuộc và để f là mật độ chung của x , sau đóx=(x1,...,xn)fx

L(θ;x)f(x;θ).

Nếu thêm tài sản Markov được thỏa mãn, thì

L(θ;x)f(x;θ)=f(x1;θ)j=1n1f(xj+1|xj;θ).

Hãy cũng xem này .


3
Từ việc bạn viết hàm khả năng như một sản phẩm, bạn đang mặc nhiên thừa nhận một cấu trúc phụ thuộc giữa các quan sát. Vì vậy, đối với MLE, người ta cần hai giả định (a) một về phân phối từng kết quả riêng lẻ và (b) một phụ thuộc vào sự phụ thuộc giữa các kết quả.

10

(+1) Câu hỏi rất hay.

Điều nhỏ, MLE là viết tắt của ước tính khả năng tối đa (không phải nhiều), có nghĩa là bạn chỉ tối đa hóa khả năng. Điều này không xác định rằng khả năng phải được tạo ra bằng cách lấy mẫu IID.

Nếu sự phụ thuộc của việc lấy mẫu có thể được viết trong mô hình thống kê, bạn chỉ cần viết khả năng phù hợp và tối đa hóa nó như bình thường.

Một trường hợp đáng nói khi bạn không giả định sự phụ thuộc là lấy mẫu Gaussian đa biến (ví dụ trong phân tích chuỗi thời gian). Sự phụ thuộc giữa hai biến Gaussian có thể được mô hình hóa bằng thuật ngữ hiệp phương sai của chúng, mà bạn kết hợp trong khả năng.

Để đưa ra một ví dụ đơn giản, giả sử rằng bạn vẽ một mẫu có kích thước từ các biến Gaussian tương quan có cùng giá trị trung bình và phương sai. Bạn sẽ viết khả năng như2

12πσ21ρ2exp(z2σ2(1ρ2)),

trong đó z

z=(x1μ)22ρ(x1μ)(x2μ)+(x2μ)2.

Đây không phải là sản phẩm của khả năng cá nhân. Tuy nhiên, bạn sẽ tối đa hóa này với các thông số để có được MLE của họ.(μ,σ,ρ)


2
Đây là những câu trả lời tốt và ví dụ. Điều duy nhất tôi muốn thêm vào để thấy điều này bằng các thuật ngữ đơn giản là ước tính khả năng chỉ yêu cầu một mô hình để tạo dữ liệu được chỉ định theo một số tham số chưa biết được mô tả ở dạng chức năng.
Michael R. Chernick

(+1) Hoàn toàn đúng! Bạn có một ví dụ về mô hình không thể được chỉ định trong các điều khoản đó không?
gui11aume

@ gu11aume Tôi nghĩ bạn đang đề cập đến nhận xét của tôi. Tôi sẽ nói rằng tôi đã không đưa ra một câu trả lời trực tiếp cho câu hỏi. Câu trả lời cho câu hỏi là có bởi vì có những ví dụ có thể được hiển thị trong đó hàm khả năng có thể được biểu thị khi dữ liệu được tạo ra bởi các biến ngẫu nhiên phụ thuộc.
Michael R. Chernick

2
Các ví dụ trong đó điều này không thể được thực hiện sẽ là nơi dữ liệu được đưa ra mà không có bất kỳ mô tả nào về cơ chế tạo dữ liệu hoặc mô hình không được trình bày ở dạng tham số như khi bạn được cung cấp hai bộ dữ liệu iid và được yêu cầu kiểm tra xem chúng có đến từ không phân phối giống nhau trong đó bạn chỉ xác định rằng các phân phối là hoàn toàn liên tục.
Michael R. Chernick

4

Tất nhiên, các mô hình ARMA Gaussian có khả năng, vì hàm hiệp phương sai của chúng có thể được dẫn xuất rõ ràng. Về cơ bản, đây là phần mở rộng câu trả lời của gui11ame cho hơn 2 quan sát. Googling tối thiểu tạo ra các bài báo như thế này trong đó khả năng được đưa ra ở dạng chung.

yij=xijβ+ui+ϵij,
jijiϵijui
lnLilnjf(yij|β,ui)dF(ui)
yij

2
Stask và @ gui11aume, ba câu trả lời này rất hay nhưng tôi nghĩ họ bỏ lỡ một điểm: còn tính nhất quán của MLE đối với dữ liệu phụ thuộc thì sao?
Stéphane Laurent
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.