Đây là một câu hỏi khá cũ với một số câu trả lời rất hay, tuy nhiên tôi nghĩ nó có thể được hưởng lợi từ một câu trả lời mới để giải quyết một quan điểm thực dụng hơn.
Khi nào thì không nên cho phép một hiệu ứng cố định thay đổi giữa các cấp độ của một hiệu ứng ngẫu nhiên?
Tôi sẽ không giải quyết các vấn đề đã được mô tả trong các câu trả lời khác, thay vào đó tôi sẽ đề cập đến bài báo nổi tiếng hiện nay, mặc dù tôi muốn nói rằng bài báo "khét tiếng" của Barr et al (2013) thường chỉ được gọi là "Giữ tối đa"
Barr, DJ, Levy, R., Scheepers, C. và Tily, HJ, 2013. Cấu trúc hiệu ứng ngẫu nhiên để kiểm tra giả thuyết xác nhận: Giữ cho nó tối đa. Tạp chí của bộ nhớ và ngôn ngữ, 68 (3), tr.255-278.
Trong bài báo này, các tác giả cho rằng tất cả các hiệu ứng cố định nên được cho phép thay đổi theo các cấp độ của các yếu tố nhóm (chặn ngẫu nhiên). Lập luận của họ khá hấp dẫn - về cơ bản là bởi không cho phép họ thay đổi, đó là áp đặt các ràng buộc đối với mô hình. Điều này được mô tả tốt trong các câu trả lời khác. Tuy nhiên, có những vấn đề nghiêm trọng tiềm tàng với phương pháp này, được mô tả bởi Bates el al (2015):
Bates, D., Kliegl, R., Vasishth, S. và Baayen, H., 2015. Mô hình hỗn hợp rắc rối. bản in sẵn arXiv arXiv arXiv: 1506.04967
Điều đáng chú ý ở đây là Bates là tác giả chính của lme4
gói phù hợp với các mô hình hỗn hợp trong R, có lẽ là gói được sử dụng rộng rãi nhất cho các mô hình như vậy. Bates et al lưu ý rằng trong nhiều ứng dụng trong thế giới thực, dữ liệu đơn giản sẽ không hỗ trợ cấu trúc hiệu ứng ngẫu nhiên tối đa, thường là do không đủ số lượng quan sát trong mỗi cụm cho các biến liên quan. Điều này có thể thể hiện trong các mô hình không hội tụ hoặc là số ít trong các hiệu ứng ngẫu nhiên. Số lượng lớn các câu hỏi trên trang web này về các mô hình như vậy chứng thực điều đó. Họ cũng lưu ý rằng Barr et al đã sử dụng một mô phỏng tương đối đơn giản, với các hiệu ứng ngẫu nhiên "hoạt động tốt" làm cơ sở cho bài báo của họ. Thay vào đó Bates et al đề xuất cách tiếp cận sau:
Chúng tôi đã đề xuất (1) sử dụng PCA để xác định tính chiều của ma trận phương sai hiệp phương sai của cấu trúc hiệu ứng ngẫu nhiên, (2) để hạn chế các tham số tương quan về 0, đặc biệt khi một nỗ lực ban đầu để phù hợp với mô hình tối đa không hội tụ, và (3) loại bỏ các thành phần phương sai không đáng kể và các tham số tương quan liên quan của chúng khỏi mô hình
Trong cùng một bài báo, họ cũng lưu ý:
Điều quan trọng, việc không hội tụ không phải do lỗi của thuật toán ước tính, mà là hậu quả đơn giản của việc cố gắng phù hợp với một mô hình quá phức tạp để được dữ liệu hỗ trợ chính xác.
Và:
mô hình tối đa là không cần thiết để bảo vệ chống lại kết luận chống bảo thủ. Sự bảo vệ này được cung cấp đầy đủ bởi các mô hình toàn diện được hướng dẫn bởi những kỳ vọng thực tế về sự phức tạp mà dữ liệu có thể hỗ trợ. Trong thống kê, như những nơi khác trong khoa học, sự khôn ngoan là một đức tính, không phải là một phó.
Bates và cộng sự (2015)
Từ góc độ ứng dụng nhiều hơn, cần xem xét thêm là liệu quá trình tạo dữ liệu, lý thuyết sinh học / vật lý / hóa học làm cơ sở dữ liệu, nên hướng dẫn nhà phân tích chỉ định cấu trúc hiệu ứng ngẫu nhiên.