Mô hình đa cấp so với các mô hình riêng biệt cho từng cấp độ


10

Những lợi thế và bất lợi của việc chạy các mô hình riêng biệt so với mô hình đa cấp là gì?

Đặc biệt hơn, giả sử một nghiên cứu kiểm tra các bệnh nhân được lồng trong các thực hành của bác sĩ được lồng trong các quốc gia. Những lợi thế / bất lợi của việc chạy các mô hình riêng biệt cho mỗi quốc gia so với mô hình lồng nhau ba cấp độ là gì?


2
Về mặt kỹ thuật, bạn cần khá nhiều đơn vị cấp 3 nếu bạn sẽ có được ước tính tham số không thiên vị trong mô hình 3 cấp (nói chung, cỡ mẫu trong bất kỳ mô hình đa cấp nào đặc biệt quan trọng ở cấp cao nhất), vì vậy trừ khi bạn có một mẫu ngẫu nhiên lớn của các quốc gia (có lẽ hơn 50), có lẽ bạn nên xem xét việc chạy các mô hình 2 cấp riêng biệt hoặc nếu bạn có ít quốc gia, bạn có thể coi quốc gia là công cụ dự báo cấp 2 phân loại trong mô hình 2 cấp
Patrick Coulombe

Xin chào @gung tôi đi vắng, tôi sẽ xem xét họ bây giờ.
Peter Flom - Tái lập Monica

Câu trả lời:


6

Câu hỏi được đề ngày nhưng tôi nghĩ nó rất quan trọng. Câu trả lời tốt nhất tôi có thể nhận được là từ cuốn sách "Ứng dụng và kỹ thuật phân tích đa cấp, phiên bản thứ hai" của Joop J Hox (2010).

Giả sử dữ liệu phân cấp hai cấp với biến giải thích ở cấp thấp nhất và biến giải thích ở cấp cao nhất. Sau đó, tại trang 55, anh viết:pq

Một mô hình hồi quy đơn cấp thông thường cho cùng một dữ liệu sẽ chỉ ước tính mức chặn, một phương sai lỗi và độ dốc hồi quy p + q. Sự vượt trội của mô hình hồi quy đa cấp là rõ ràng, nếu chúng ta xem xét rằng dữ liệu được nhóm lại trong các nhóm. Nếu chúng ta có 100 nhóm, ước tính một mô hình hồi quy bội thông thường trong mỗi nhóm riêng biệt đòi hỏi phải ước tính 100 × (1 chặn hồi quy + 1 phương sai dư + độ dốc hồi quy p) cộng với các tương tác có thể có với các biến cấp độ nhóm q. Hồi quy đa cấp thay thế ước tính 100 lần chặn bằng cách ước tính mức chặn trung bình cộng với phương sai dư của nó giữa các nhóm, giả sử phân phối bình thường cho các phần dư này. Như vậy phân tích hồi quy đa cấp thay thế cho việc ước tính 100 lần chặn riêng biệt bằng cách ước tính hai tham số (giá trị trung bình và phương sai của các lần chặn), cộng với giả định quy tắc. Việc đơn giản hóa tương tự được sử dụng cho các sườn hồi quy. Thay vì ước tính 100 độ dốc cho giới tính học sinh biến giải thích, chúng tôi ước tính độ dốc trung bình cùng với phương sai của nó giữa các nhóm và giả định rằng sự phân bố của các sườn là bình thường. Tuy nhiên, ngay cả với một số lượng nhỏ các biến giải thích, phân tích hồi quy đa cấp cho thấy một mô hình phức tạp. Nói chung, chúng tôi không muốn ước tính mô hình hoàn chỉnh, trước tiên vì điều này có thể khiến chúng tôi gặp vấn đề về tính toán, nhưng cũng vì rất khó để diễn giải một mô hình phức tạp như vậy.

Đó là cho mô tả. Bây giờ các trang 29-30 sẽ trả lời câu hỏi của bạn chính xác hơn.

Các chặn và độ dốc dự đoán cho 100 lớp không giống với các giá trị chúng ta sẽ có được nếu chúng ta thực hiện 100 phân tích hồi quy thông thường riêng biệt trong mỗi 100 lớp, sử dụng các kỹ thuật bình phương nhỏ nhất (OLS) tiêu chuẩn. Nếu chúng ta so sánh các kết quả từ 100 phân tích hồi quy OLS riêng biệt với các giá trị thu được từ phân tích hồi quy đa cấp, chúng ta sẽ thấy rằng các kết quả từ các phân tích riêng biệt có nhiều thay đổi. Điều này là do các ước tính đa cấp của các hệ số hồi quy của 100 lớp được tính trọng số. Chúng được gọi là ước lượng Bay thực nghiệm (EB) hoặc ước tính co ngót: trung bình trọng số của ước tính OLS cụ thể trong mỗi lớp và hệ số hồi quy tổng thể, ước tính cho tất cả các lớp tương tự.

Kết quả là, các hệ số hồi quy được thu hẹp về phía hệ số trung bình cho toàn bộ tập dữ liệu. Trọng lượng co ngót phụ thuộc vào độ tin cậy của hệ số ước tính. Các hệ số được ước tính với độ chính xác nhỏ co lại nhiều hơn các hệ số ước tính rất chính xác. Độ chính xác của ước tính phụ thuộc vào hai yếu tố: kích thước mẫu của nhóm và khoảng cách giữa ước tính dựa trên nhóm và ước tính tổng thể. Ước tính cho các nhóm nhỏ là ít đáng tin cậy và thu nhỏ hơn so với ước tính cho các nhóm lớn. Những thứ khác bằng nhau, các ước tính rất xa so với ước tính tổng thể được cho là kém tin cậy hơn và chúng thu nhỏ hơn so với ước tính gần với mức trung bình chung. Phương pháp thống kê được sử dụng được gọi là ước lượng Bayes theo kinh nghiệm. Vì hiệu ứng co ngót này, ước tính Bayes theo kinh nghiệm là sai lệch. Tuy nhiên, chúng thường chính xác hơn, một thuộc tính thường hữu ích hơn là không thiên vị (xem Kendall, 1959).

Tôi hy vọng nó thỏa mãn.


2

Chỉ định một hiệu ứng ngẫu nhiên liên quan đến việc giả định rằng phương tiện của các mức đó là các mẫu từ phân phối bình thường. Tốt hơn là chỉ định chúng là các hiệu ứng cố định, các biến giả AKA nếu giả định này không phù hợp với dữ liệu của bạn. Theo cách này, bạn đang kiểm soát mức độ không đồng nhất theo nhóm trong trung bình (ở cấp độ đó), nhưng bạn KHÔNG cho phép sự không đồng nhất trong các phản ứng với các biến cấp thấp hơn của bạn.

Nếu bạn mong đợi sự không đồng nhất để đáp ứng với các biến giải thích ở cấp độ thấp hơn, các mô hình riêng biệt có ý nghĩa, trừ khi bạn muốn chạy một số mô hình hệ số ngẫu nhiên (một lần nữa liên quan đến giả định rằng các hệ số thường được phân phối).

(Tôi tin rằng có các phương pháp cho các hiệu ứng ngẫu nhiên không bình thường, nhưng không có gì được sử dụng rộng rãi hoặc có thể truy cập như lme)


1

Ưu điểm: Khả năng kiểm tra rõ ràng sự khác biệt về tham số theo cụm (nghĩa là sự khác biệt về ý nghĩa không có nghĩa là sự khác biệt đáng kể).


2
Câu trả lời này quá ngắn. Nhiều hơn một bình luận hơn là một câu trả lời.
Eric Peterson
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.