Trong thực tế, ma trận hiệp phương sai hiệu ứng ngẫu nhiên được tính toán như thế nào trong một mô hình hiệu ứng hỗn hợp?


19

Về cơ bản điều tôi đang tự hỏi là các cấu trúc hiệp phương sai khác nhau được thi hành như thế nào và cách tính các giá trị bên trong các ma trận này. Các hàm như lme () cho phép chúng ta chọn cấu trúc nào chúng ta muốn, nhưng tôi muốn biết cách ước tính chúng.

Hãy xem xét mô hình hiệu ứng hỗn hợp tuyến tính .Y=Xβ+Zu+ϵ

Trong đó udN(0,D)ϵdN(0,R) . Hơn nữa:

Var(Y|X,Z,β,u)=R

Var(Y|X,β)=ZDZ+R=V

Để đơn giản, chúng tôi sẽ giả sử R=σ2In .

Về cơ bản câu hỏi của tôi là: D ước tính chính xác từ dữ liệu cho các tham số khác nhau như thế nào? Nói nếu chúng ta giả sử D là đường chéo (hiệu ứng ngẫu nhiên là độc lập) hoặc D được tham số hóa đầy đủ (trường hợp tôi quan tâm hơn vào lúc này) hoặc bất kỳ tham số nào khác? Có ước tính / phương trình đơn giản cho những? (Điều đó chắc chắn sẽ được ước tính lặp đi lặp lại.)

EDIT: Từ cuốn sách Thành phần phương sai (Searle, Casella, McCulloch 2006) Tôi đã xoay sở để phát sáng như sau:

Nếu D=σu2Iq thì các thành phần phương sai được cập nhật và tính toán như sau:

σu2(k+1)=u^Tu^σu2(k)trace(V1ZTZ)

σe2(k+1)=Y(YXβ^(k)Zu^(k))/n

Trong đó β^(k)u^(k) là các bản cập nhật thứ k tương ứng.

Có công thức chung khi D là đường chéo khối hoặc tham số đầy đủ không? Tôi đoán trong trường hợp được tham số hóa đầy đủ, một phép phân tách Cholesky được sử dụng để đảm bảo tính chính xác và tính đối xứng dương.


2
arxiv.org/pdf/1406.5823 (báo chí tại Tạp chí Phần mềm Thống kê ) có thể hữu ích ...
Ben Bolker 18/03/2015

Câu trả lời:


8

Goldstein .pdf @probabilityislogic được liên kết là một tài liệu tuyệt vời. Dưới đây là danh sách một số tài liệu tham khảo thảo luận về câu hỏi cụ thể của bạn:

Harville, 1976: Mở rộng Định lý Gauss-Markov để bao gồm ước tính hiệu ứng ngẫu nhiên .

Harville, 1977: Khả năng tối đa tiếp cận với ước tính thành phần phương sai và các vấn đề liên quan .

Laird và Ware, 1982: Các mô hình hiệu ứng ngẫu nhiên cho dữ liệu theo chiều dọc .

McCulloch, 1997: Các thuật toán khả năng tối đa cho các mô hình hỗn hợp tuyến tính tổng quát .

Các Hướng dẫn SAS tài khoản trích cho các thủ tục TRỘN có một số thông tin tuyệt vời về ước lượng hiệp phương sai và nhiều nguồn hơn (bắt đầu từ trang 3968).

Có rất nhiều sách giáo khoa chất lượng về phân tích dữ liệu theo chiều dọc / lặp đi lặp lại, nhưng đây là một cuốn sách đi sâu vào chi tiết về việc thực hiện trong R (từ các tác giả của lme4nlme):

Pinheiro và Bates, 2000: Các mô hình hiệu ứng hỗn hợp trong S và S-PLUS .

EDIT : Thêm một bài báo liên quan: Lindstrom và Bates, 1988: Thuật toán Newton-Raphson và EM cho các mô hình hiệu ứng hỗn hợp tuyến tính cho dữ liệu đo lặp lại .

EDIT 2 : Và một cái khác: Jennrich và Schluchter, 1986: Các mô hình đo lường lặp lại không cân bằng với ma trận hiệp phương sai có cấu trúc .


Tôi đã xem Pinheiro và Bates, cụ thể là Chương 2 (về lý thuyết và tính toán) nhưng dường như tôi không thấy bất cứ điều gì về cách cấu trúc hiệp phương sai được thi hành và ước tính? Tôi sẽ đi qua nó một lần nữa. Tôi đã có một vài trong số những tờ giấy đó chỉ ngồi đây, tôi chắc chắn sẽ phải đọc lại chúng. Chúc mừng.
dcl

1
@dcl Nhìn lại Chương 2 của P & B, tôi thấy rằng họ có thể đang theo dõi một số bước bạn quan tâm (họ đề cập đến việc tối ưu hóa khả năng ghi nhật ký các tham số hiệp phương sai nhưng không nói như thế nào ). Điều đó đang được nói, Mục 2.2.8 có thể là phần giải quyết câu hỏi của bạn tốt nhất.

1
@dcl Đã thêm một nguồn có thể giúp đỡ.

cảm ơn các liên kết Tôi đã có một lần duyệt qua các giấy tờ này trong quá khứ, một số trong số chúng khá kỹ thuật đối với tôi. Bây giờ tôi sẽ có một trình duyệt khác thông qua chúng, nhưng thoạt nhìn tôi dường như không thể có được thứ tôi muốn từ chúng.
dcl

1
@dcl Xin lỗi về bức tường của các liên kết, nhưng câu hỏi của bạn là một câu hỏi mà một người có thể dành cho một vài bài giảng đầy đủ để thảo luận (đó là một câu hỏi rất hay đó là loại bị cuốn theo tấm thảm khi lần đầu tiên tìm hiểu về các mô hình hiệu ứng hỗn hợp). Ngoài việc bơi qua các tài liệu, một điều bạn có thể làm là xem mã nguồn lme4và xem cách nó giải quyết với ước tính này.

7

Harvey Goldstein không phải là một nơi tồi tệ để bắt đầu.

Như với hầu hết các phương pháp ước tính phức tạp, nó thay đổi theo gói phần mềm. Tuy nhiên, thường thì những gì được thực hiện là trong các bước sau:

  1. Chọn một giá trị ban đầu cho (nói D 0 ) và R (nói R 0 ). Đặt i = 1DD0RR0i=1
  2. Có điều kiện trên R = R i - 1 , ước tính βuε . Gọi các ước tính β iu iϵ i .D=Di1R=Ri1βuϵβiuiϵi
  3. Có điều kiện về u = u iε = ε i , ước tính DR . Gọi các ước tính D iR iβ=βiu=uiϵ=ϵiDRDiRi
  4. i=i+1

Một phương pháp đơn giản và nhanh chóng là IGLS, dựa trên việc lặp lại giữa hai thủ tục bình phương nhỏ nhất và được mô tả chi tiết trong chương hai. Nhược điểm là nó không hoạt động tốt đối với các thành phần phương sai gần bằng không.


Tôi biết rằng đây là phương pháp chung, nhưng D và R được ước tính như thế nào, phương trình nào được sử dụng cho các cấu trúc khác nhau? Giá trị ban đầu tốt là gì? Tôi sẽ kiểm tra pdf bây giờ, chúc mừng.
dcl


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.