Tôi đang đọc bài lý thuyết của Doug Bates trên gói lme4 của R để hiểu rõ hơn về sự đa dạng của các mô hình hỗn hợp, và đã tìm thấy một kết quả hấp dẫn mà tôi muốn hiểu rõ hơn, về việc sử dụng khả năng tối đa hạn chế (REML) để ước tính phương sai .
Trong phần 3.3 về tiêu chí REML, ông nói rằng việc sử dụng REML trong ước lượng phương sai có liên quan chặt chẽ đến việc sử dụng mức độ hiệu chỉnh tự do khi ước tính phương sai từ độ lệch dư trong mô hình tuyến tính phù hợp. Cụ thể, "mặc dù không thường xuất phát theo cách này", mức độ hiệu chỉnh tự do có thể được lấy bằng cách ước tính phương sai thông qua tối ưu hóa "tiêu chí REML" (Phương trình (28)). Tiêu chí REML về cơ bản chỉ là khả năng, nhưng các tham số phù hợp tuyến tính đã được loại bỏ bằng cách đặt lề (thay vì đặt chúng bằng với ước tính phù hợp, sẽ đưa ra phương sai mẫu sai lệch).
Tôi đã làm toán và xác minh kết quả được yêu cầu cho một mô hình tuyến tính đơn giản chỉ với các hiệu ứng cố định. Những gì tôi đang đấu tranh với là sự giải thích. Có một số quan điểm mà từ đó là tự nhiên để rút ra một ước tính phương sai bằng cách tối ưu hóa khả năng các tham số phù hợp đã bị gạt ra ngoài lề? Nó cảm thấy giống như Bayes, như thể tôi đang nghĩ về khả năng là một hậu thế và bỏ qua các tham số phù hợp như thể chúng là các biến ngẫu nhiên.
Hoặc là sự biện minh chủ yếu chỉ là toán học - nó hoạt động trong trường hợp tuyến tính nhưng cũng có thể khái quát hóa?