Câu hỏi được đề ngày nhưng tôi nghĩ nó rất quan trọng. Câu trả lời tốt nhất tôi có thể nhận được là từ cuốn sách "Ứng dụng và kỹ thuật phân tích đa cấp, phiên bản thứ hai" của Joop J Hox (2010).
Giả sử dữ liệu phân cấp hai cấp với biến giải thích ở cấp thấp nhất và biến giải thích ở cấp cao nhất. Sau đó, tại trang 55, anh viết:pq
Một mô hình hồi quy đơn cấp thông thường cho cùng một dữ liệu sẽ chỉ ước tính mức chặn, một phương sai lỗi và độ dốc hồi quy p + q. Sự vượt trội của mô hình hồi quy đa cấp là rõ ràng, nếu chúng ta xem xét rằng dữ liệu được nhóm lại trong các nhóm. Nếu chúng ta có 100 nhóm, ước tính một mô hình hồi quy bội thông thường trong mỗi nhóm riêng biệt đòi hỏi phải ước tính 100 × (1 chặn hồi quy + 1 phương sai dư + độ dốc hồi quy p) cộng với các tương tác có thể có với các biến cấp độ nhóm q. Hồi quy đa cấp thay thế ước tính 100 lần chặn bằng cách ước tính mức chặn trung bình cộng với phương sai dư của nó giữa các nhóm, giả sử phân phối bình thường cho các phần dư này. Như vậy phân tích hồi quy đa cấp thay thế cho việc ước tính 100 lần chặn riêng biệt bằng cách ước tính hai tham số (giá trị trung bình và phương sai của các lần chặn), cộng với giả định quy tắc. Việc đơn giản hóa tương tự được sử dụng cho các sườn hồi quy. Thay vì ước tính 100 độ dốc cho giới tính học sinh biến giải thích, chúng tôi ước tính độ dốc trung bình cùng với phương sai của nó giữa các nhóm và giả định rằng sự phân bố của các sườn là bình thường. Tuy nhiên, ngay cả với một số lượng nhỏ các biến giải thích, phân tích hồi quy đa cấp cho thấy một mô hình phức tạp. Nói chung, chúng tôi không muốn ước tính mô hình hoàn chỉnh, trước tiên vì điều này có thể khiến chúng tôi gặp vấn đề về tính toán, nhưng cũng vì rất khó để diễn giải một mô hình phức tạp như vậy.
Đó là cho mô tả. Bây giờ các trang 29-30 sẽ trả lời câu hỏi của bạn chính xác hơn.
Các chặn và độ dốc dự đoán cho 100 lớp không giống với các giá trị chúng ta sẽ có được nếu chúng ta thực hiện 100 phân tích hồi quy thông thường riêng biệt trong mỗi 100 lớp, sử dụng các kỹ thuật bình phương nhỏ nhất (OLS) tiêu chuẩn. Nếu chúng ta so sánh các kết quả từ 100 phân tích hồi quy OLS riêng biệt với các giá trị thu được từ phân tích hồi quy đa cấp, chúng ta sẽ thấy rằng các kết quả từ các phân tích riêng biệt có nhiều thay đổi. Điều này là do các ước tính đa cấp của các hệ số hồi quy của 100 lớp được tính trọng số. Chúng được gọi là ước lượng Bay thực nghiệm (EB) hoặc ước tính co ngót: trung bình trọng số của ước tính OLS cụ thể trong mỗi lớp và hệ số hồi quy tổng thể, ước tính cho tất cả các lớp tương tự.
Kết quả là, các hệ số hồi quy được thu hẹp về phía hệ số trung bình cho toàn bộ tập dữ liệu. Trọng lượng co ngót phụ thuộc vào độ tin cậy của hệ số ước tính. Các hệ số được ước tính với độ chính xác nhỏ co lại nhiều hơn các hệ số ước tính rất chính xác. Độ chính xác của ước tính phụ thuộc vào hai yếu tố: kích thước mẫu của nhóm và khoảng cách giữa ước tính dựa trên nhóm và ước tính tổng thể. Ước tính cho các nhóm nhỏ là ít đáng tin cậy và thu nhỏ hơn so với ước tính cho các nhóm lớn. Những thứ khác bằng nhau, các ước tính rất xa so với ước tính tổng thể được cho là kém tin cậy hơn và chúng thu nhỏ hơn so với ước tính gần với mức trung bình chung. Phương pháp thống kê được sử dụng được gọi là ước lượng Bayes theo kinh nghiệm. Vì hiệu ứng co ngót này, ước tính Bayes theo kinh nghiệm là sai lệch. Tuy nhiên, chúng thường chính xác hơn, một thuộc tính thường hữu ích hơn là không thiên vị (xem Kendall, 1959).
Tôi hy vọng nó thỏa mãn.