Tại sao chính xác thông tin quan sát được sử dụng?


17

Trong cài đặt khả năng tối đa tiêu chuẩn (iid mẫu từ một số phân phối có mật độ )) và trong trường hợp mô hình được chỉ định chính xác, Fisher thông tin được cung cấp bởiY1,,Ynfy(y|θ0

I(θ)=Eθ0[2θ2lnfy(θ)]

trong đó kỳ vọng được thực hiện liên quan đến mật độ thực sự tạo ra dữ liệu. Tôi đã đọc được thông tin quan sát của Fisher

J^(θ)= =-2θ2lnfy(θ)

được sử dụng chính vì tích phân liên quan đến việc tính toán Thông tin Fisher (dự kiến) có thể không khả thi trong một số trường hợp. Điều khiến tôi bối rối là ngay cả khi tích phân là có thể thực hiện được, thì kỳ vọng phải được thực hiện đối với mô hình thực, liên quan đến giá trị tham số chưa biết . Nếu đúng như vậy có vẻ như không biết nó là không thể để tính toán . Điều này có đúng không?θ0θ0Tôi

Câu trả lời:


13

Bạn đã có bốn số lượng ở đây: tham số thực , ước tính nhất quán , thông tin dự kiến tại và thông tin quan sát tại . Các đại lượng này chỉ tương đương không có triệu chứng, nhưng đó thường là cách chúng được sử dụng.θ tôi ( θ ) θ J ( θ ) θθ0θ^Tôi(θ)θJ(θ)θ

  1. Thông tin quan sát được hội tụ xác suất với thông tin dự kiến khi là mẫu iid từ . Ở đây biểu thị kỳ vọng w / r / t phân phối được lập chỉ mục bởi : . Sự hội tụ này được duy trì vì luật số lượng lớn, do đó, giả định rằng rất quan trọng ở đây.Tôi(θ0)=Eθ0[2

    J(θ0)= =1NΣTôi= =1N2θ02lnf(yTôi|θ0)
    Yf(θ0)Eθ0(x)θ0xf(x|θ0)dxY~f(θ0)
    Tôi(θ0)= =Eθ0[2θ02lnf(y|θ0)]
    Yf(θ0)Eθ0(x)θ0xf(x|θ0)dxY~f(θ0)
  2. Khi bạn có ước tính hội tụ xác suất theo tham số thực (nghĩa là phù hợp) thì bạn có thể thay thế nó cho bất kỳ nơi nào bạn thấy ở trên, về cơ bản là do định lý ánh xạ liên tục và tất cả các điểm hội tụ tiếp tục được tổ chức. q0θ^θ0θ0*

* Trên thực tế, nó có vẻ là một chút tinh tế .

Ghi chú

Như bạn đã phỏng đoán, thông tin quan sát thường dễ làm việc hơn vì sự khác biệt dễ hơn tích hợp và bạn có thể đã đánh giá nó trong quá trình tối ưu hóa số. Trong một số trường hợp (phân phối chuẩn) chúng sẽ giống nhau.

Bài viết "Đánh giá độ chính xác của công cụ ước tính khả năng tối đa: Thông tin về dự đoán câu cá được quan sát" của Efron và Hinkley (1978) đưa ra lập luận ủng hộ thông tin quan sát được cho các mẫu hữu hạn.


4

Đã có một số nghiên cứu mô phỏng xuất hiện ủng hộ các quan sát lý thuyết của Efron & Hinkley (được đề cập trong câu trả lời của Andrew), đây là một nghiên cứu mà tôi biết về tay trái: Maldonado, G. và Greenland, S. (1994). So sánh hiệu suất của các khoảng tin cậy dựa trên mô hình khi không xác định được mẫu chính xác. Dịch tễ học, 5, 171-182. Tôi chưa thấy nghiên cứu nào xung đột. Điều thú vị là các gói GLM tiêu chuẩn mà tôi biết sử dụng thông tin dự kiến ​​để tính các khoảng Wald. Tất nhiên đây không phải là vấn đề khi (như trong GLMs tuyến tính trong tham số tự nhiên) các ma trận thông tin quan sát và dự kiến ​​là bằng nhau.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.