Lỗi tiêu chuẩn cụm so với mô hình đa cấp?


18

Tôi đã đọc lướt qua một vài cuốn sách (Raudenbush & Bryk, Snijder & Bosker, Gelman & Hill, v.v.) và một số bài viết (Gelman, Jusko, Primo & Jacobsmeier, v.v.), và tôi vẫn không thực sự quấn đầu mình sự khác biệt chính giữa việc sử dụng các lỗi tiêu chuẩn phân cụm trong mô hình đa cấp.

Tôi hiểu các phần có liên quan đến câu hỏi nghiên cứu; có một số loại câu trả lời nhất định bạn chỉ có thể nhận được từ mô hình đa cấp. Tuy nhiên, ví dụ, đối với mô hình hai cấp trong đó các hệ số quan tâm của bạn chỉ ở cấp độ thứ hai, lợi thế của việc thực hiện một phương pháp so với phương pháp kia là gì? Trong trường hợp này, tôi không lo lắng về việc đưa ra dự đoán hoặc trích xuất các hệ số riêng lẻ cho các cụm.

Sự khác biệt chính mà tôi có thể tìm thấy là các lỗi tiêu chuẩn phân cụm phải chịu khi các cụm có kích thước mẫu không đồng đều và mô hình đa cấp yếu ở chỗ nó giả định một đặc điểm phân phối hệ số ngẫu nhiên (trong khi sử dụng các lỗi tiêu chuẩn phân cụm là không có mô hình) .

Và cuối cùng, liệu tất cả những điều này có nghĩa là đối với các mô hình có thể sử dụng một trong hai phương pháp, chúng ta sẽ nhận được kết quả tương tự về hệ số và sai số chuẩn?

Bất kỳ câu trả lời hoặc tài nguyên hữu ích sẽ được đánh giá rất cao.


6
người dùng Stask có một câu trả lời hay cho chính xác câu hỏi này .
Andy W

Cảm ơn. Tôi đã đọc điều đó trước đây, điều này thực sự khiến tôi hoài nghi hơn về lợi ích thực sự. Tuy nhiên, tôi đoán động lực thực sự đằng sau câu hỏi của tôi là để xem liệu tôi có xác thực được không khi nghĩ rằng nó không quá hữu ích nếu tôi chỉ xem các hệ số cấp hai là mối quan tâm. Ngoài ra, có lẽ tôi đã bỏ lỡ nó, nhưng tôi không nghĩ rằng bài đăng đó đề cập đến việc liệu hai phương pháp này có tạo ra kết quả tương tự hay không (khi các giả định của cả hai phương pháp đều được đáp ứng).
RickyB

1
Với "hệ số ở cấp độ thứ hai", bạn có nghĩa là cấp độ mà các tham số của giai đoạn đầu tiên là biến phụ thuộc?
sheß

Vâng, đó là những gì tôi có ý nghĩa.
RickyB

Câu trả lời:


1

Bài đăng này dựa trên kinh nghiệm cá nhân có thể cụ thể cho dữ liệu của tôi, vì vậy tôi không chắc nó đủ điều kiện để trả lời.

Tôi đề nghị sử dụng mô phỏng nếu có thể để đánh giá phương pháp nào phù hợp nhất với dữ liệu của bạn. Tôi đã làm điều này và rất ngạc nhiên khi thấy rằng các thử nghiệm (liên quan đến các tham số ở cấp độ đầu tiên) dựa trên mô hình đa cấp vượt trội hơn bất kỳ phương pháp nào khác (thông minh về năng lượng), trong khi vẫn giữ kích thước ngay cả trong các mẫu nhỏ với vài "cụm" có kích thước không đồng đều. Tôi vẫn chưa tìm thấy một bài báo đưa ra quan điểm đó, và từ cách tôi thấy đây không thực sự là một chủ đề thích hợp và đáng được chú ý hơn. Tôi nghĩ rằng nó chưa được nghiên cứu kỹ về cách các phương pháp khác nhau so sánh mẫu hữu hạn vis-a-vis hoặc một vài cụm / không đồng đều.


Cảm ơn bình luận của bạn. Bạn có tình cờ có tài liệu nào ghi lại kết quả của bạn không? Tôi sẽ rất thích thú khi nhìn vào nó và xem những gì bạn tìm thấy (và tất nhiên, tôi sẽ không trích dẫn, chia sẻ hoặc cải thiện nó mà không thảo luận với bạn).
RickyB
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.