Tại sao khả năng tối đa bị hạn chế mang lại ước tính tốt hơn (không thiên vị) về phương sai?


11

Tôi đang đọc bài lý thuyết của Doug Bates trên gói lme4 của R để hiểu rõ hơn về sự đa dạng của các mô hình hỗn hợp, và đã tìm thấy một kết quả hấp dẫn mà tôi muốn hiểu rõ hơn, về việc sử dụng khả năng tối đa hạn chế (REML) để ước tính phương sai .

Trong phần 3.3 về tiêu chí REML, ông nói rằng việc sử dụng REML trong ước lượng phương sai có liên quan chặt chẽ đến việc sử dụng mức độ hiệu chỉnh tự do khi ước tính phương sai từ độ lệch dư trong mô hình tuyến tính phù hợp. Cụ thể, "mặc dù không thường xuất phát theo cách này", mức độ hiệu chỉnh tự do có thể được lấy bằng cách ước tính phương sai thông qua tối ưu hóa "tiêu chí REML" (Phương trình (28)). Tiêu chí REML về cơ bản chỉ là khả năng, nhưng các tham số phù hợp tuyến tính đã được loại bỏ bằng cách đặt lề (thay vì đặt chúng bằng với ước tính phù hợp, sẽ đưa ra phương sai mẫu sai lệch).

Tôi đã làm toán và xác minh kết quả được yêu cầu cho một mô hình tuyến tính đơn giản chỉ với các hiệu ứng cố định. Những gì tôi đang đấu tranh với là sự giải thích. Có một số quan điểm mà từ đó là tự nhiên để rút ra một ước tính phương sai bằng cách tối ưu hóa khả năng các tham số phù hợp đã bị gạt ra ngoài lề? Nó cảm thấy giống như Bayes, như thể tôi đang nghĩ về khả năng là một hậu thế và bỏ qua các tham số phù hợp như thể chúng là các biến ngẫu nhiên.

Hoặc là sự biện minh chủ yếu chỉ là toán học - nó hoạt động trong trường hợp tuyến tính nhưng cũng có thể khái quát hóa?

Câu trả lời:


4

n-1

Do đó, các luồng cố định xác định mô hình 'cho giá trị trung bình', do đó, nếu bạn có thể tìm thấy một ước lượng phương sai được lấy mà không ước tính giá trị trung bình từ dữ liệu (bằng cách 'bỏ qua các hiệu ứng cố định (nghĩa là trung bình)') thì việc đánh giá thấp này sự lây lan (tức là phương sai) sẽ được giảm nhẹ.

Đây là cách hiểu 'trực quan' tại sao các ước tính của REML loại bỏ sự thiên vị; bạn tìm thấy một ước tính cho phương sai mà không sử dụng 'giá trị trung bình ước tính'.


1

Kiểm tra PHỤ LỤC: PHƯƠNG PHÁP DỰ TOÁN NHỚ từ trong tài nguyên liên quan đến SAS này của tác giả David Dickey.

" Chúng ta luôn có thể tìm (n-1) số Z với trung bình 0 đã biết và cùng một tổng bình phương và phương sai lý thuyết với các giá trị n Y. Điều này thúc đẩy việc chia tổng bình phương Z cho số Z, là n -1. "

Khi tôi còn đi học, REML đã trở thành thứ tuyệt nhất kể từ khi cắt lát bánh mì. Từ việc nghiên cứu gói lme4 , tôi đã học được rằng nó không thực sự khái quát hóa tốt như vậy và có lẽ nó không quan trọng trong sơ đồ lớn của mọi thứ.


Có lẽ không ... một chút thú vị của toán học và số liệu thống kê.
Paul

Tôi đồng ý Paul. Tôi nghĩ rằng REML là một ví dụ tuyệt vời về giải quyết vấn đề thanh lịch và sáng tạo trong Thống kê. Nó chắc chắn được sử dụng trong thực tế và có lẽ đó là tất cả những gì bạn có thể hy vọng trong nghiên cứu thống kê.
Ben Ogorek
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.