So sánh được phép của các mô hình hiệu ứng hỗn hợp (chủ yếu là các hiệu ứng ngẫu nhiên)


20

Tôi đã xem xét mô hình hóa hiệu ứng hỗn hợp bằng cách sử dụng gói lme4 trong R. Tôi chủ yếu sử dụng lmerlệnh vì vậy tôi sẽ đặt câu hỏi của mình thông qua mã sử dụng cú pháp đó. Tôi cho rằng một câu hỏi dễ nói chung có thể là, liệu có thể so sánh bất kỳ hai mô hình nào được xây dựng lmerbằng cách sử dụng các tỷ lệ khả năng dựa trên các bộ dữ liệu giống hệt nhau không? Tôi tin rằng câu trả lời phải là "không", nhưng tôi có thể không chính xác. Tôi đã đọc thông tin mâu thuẫn về việc liệu các hiệu ứng ngẫu nhiên có giống nhau hay không, và thành phần nào của các hiệu ứng ngẫu nhiên có nghĩa là gì? Vì vậy, tôi sẽ trình bày một vài ví dụ. Tôi sẽ lấy chúng từ dữ liệu đo lặp đi lặp lại bằng cách sử dụng kích thích từ, có lẽ thứ gì đó như Baayen (2008) sẽ hữu ích trong việc diễn giải.

Giả sử tôi có một mô hình trong đó có hai yếu tố dự đoán hiệu ứng cố định, chúng tôi sẽ gọi chúng là A và B, và một số hiệu ứng ngẫu nhiên ... các từ và chủ đề nhận biết chúng. Tôi có thể xây dựng một mô hình như sau.

m <- lmer( y ~ A + B + (1|words) + (1|subjects) )

(lưu ý rằng tôi đã cố tình bỏ đi data =và chúng tôi sẽ cho rằng tôi luôn có ý nghĩa REML = FALSEcho sự rõ ràng)

Bây giờ, trong số các mô hình sau đây, có thể so sánh với tỷ lệ khả năng với mô hình ở trên và mô hình nào không?

m1 <- lmer( y ~ A + B + (A+B|words) + (1|subjects) )
m2 <- lmer( y ~ A + B + (1|subjects) )              
m3 <- lmer( y ~ A + B + (C|words) + (A+B|subjects) )
m4 <- lmer( y ~ A + B + (1|words) )                 
m5 <- lmer( y ~ A * B + (1|subjects) )   

Tôi thừa nhận rằng việc giải thích một số khác biệt này có thể khó khăn hoặc không thể. Nhưng hãy để nó qua một bên. Tôi chỉ muốn biết liệu có điều gì cơ bản trong những thay đổi ở đây loại trừ khả năng so sánh hay không. Tôi cũng muốn biết liệu, nếu các LR có ổn không, và AIC cũng so sánh.



(Tôi nhận thấy bạn đã xóa thẻ [kiểm tra giả thuyết] mà tôi đã thêm trước đây. Vâng, tùy bạn, nhưng tôi nghĩ nó phù hợp: kiểm tra tỷ lệ khả năng rõ ràng là một quy trình kiểm tra giả thuyết và [mô hình hỗn hợp] + [kiểm tra giả thuyết ] là IMHO một sự kết hợp thẻ thông tin, xem stats.stackexchange.com/questions/tagged/ mẹo )
amoeba nói

Đã chỉnh sửa để xóa "kiểm tra" khỏi LR. Các LR có thể được giải thích mà không cần kiểm tra và nó làm cho nó song song hơn với AIC và làm theo ý định thực sự của tôi tốt hơn. Cảm ơn đã chỉ ra rằng.
John

Câu trả lời:


13

Sử dụng khả năng tối đa, bất kỳ trong số này có thể được so sánh với AIC; nếu các hiệu ứng cố định là như nhau ( m1đến m4), sử dụng REML hoặc ML là tốt, với REML thường được ưa thích, nhưng nếu chúng khác nhau, chỉ có thể sử dụng ML. Tuy nhiên, việc giải thích thường khó khăn khi cả hiệu ứng cố định và hiệu ứng ngẫu nhiên đều thay đổi, vì vậy trong thực tế, hầu hết đều khuyên chỉ nên thay đổi cái này hoặc cái khác tại một thời điểm.

Sử dụng kiểm tra tỷ lệ khả năng là có thể nhưng lộn xộn vì phép tính xấp xỉ bình phương chi bình thường không giữ được khi kiểm tra nếu một thành phần phương sai bằng không. Xem câu trả lời của Aniko để biết chi tiết. (Kudos nói với Aniko vì cả hai đều đọc câu hỏi cẩn thận hơn tôi và đọc câu trả lời ban đầu của tôi đủ cẩn thận để nhận thấy rằng nó đã bỏ lỡ điểm này. Cảm ơn!)

Pinhiero / Bates là tài liệu tham khảo cổ điển; nó mô tả nlmegói, nhưng lý thuyết là như nhau. Vâng, chủ yếu là giống nhau; Doug Bates đã thay đổi các khuyến nghị của mình về suy luận kể từ khi viết cuốn sách đó và các khuyến nghị mới được phản ánh trong lme4gói. Nhưng đó là nhiều hơn tôi muốn vào đây. Một tài liệu tham khảo dễ đọc hơn là Weiss (2005), Mô hình hóa dữ liệu theo chiều dọc.


mô hình m2 và m4 hoặc m1 và m3 không thể so sánh với thử nghiệm tỷ lệ khả năng. Chúng không phải là mô hình lồng nhau.
Macro

Rất tiếc, cảm ơn vì đã nắm bắt được điều đó, @Macro! Xem chỉnh sửa.
Aaron - Tái lập Monica

Câu hỏi chỉ là về việc so sánh các mô hình với mô hình m, không phải với nhau. Nhưng tuy nhiên, bạn đang nói rằng các so sánh AIC có thể được thực hiện ngay cả khi không được lồng nhau? Câu trả lời cho câu hỏi này dường như mâu thuẫn với điều đó.
Giăng

@ John, tôi đã đọc những câu trả lời đó nhưng đã bỏ lỡ nơi nó thảo luận về AIC và không lồng nhau. Tôi khá chắc chắn rằng nó ổn, nhưng bạn có thể cho tôi một con trỏ chính xác hơn đến điểm đó trong câu trả lời không?
Aaron - Tái lập Monica

Tôi đánh giá thấp câu trả lời, bởi vì bạn đã sai (hoặc ít nhất là sai lệch) về khả năng áp dụng của bài kiểm tra tỷ lệ khả năng.
Aniko

12

mmm4σ2= =0

mm212χ12+12χ02χ12.

Tuy nhiên, như @Aaron đã nêu, nhiều chuyên gia không khuyên bạn nên thực hiện kiểm tra tỷ lệ khả năng như thế này. Các lựa chọn thay thế tiềm năng là các tiêu chí thông tin (AIC, BIC, v.v.) hoặc khởi động LRT.

[1] Tự, SG & Liang, K. Tính chất tiệm cận của các ước tính khả năng tối đa và kiểm tra tỷ lệ khả năng trong các điều kiện không đạt tiêu chuẩn J. Amer. Thống kê. PGS, 1987, 82, 605-610.


1
Cảm ơn thông tin về LR. Tôi đã không thực sự nghĩ về vấn đề ranh giới LR khi làm các mô hình cho ví dụ. Tôi chỉ nhận thấy rằng câu trả lời của bạn không rõ ràng nếu đề xuất của bạn áp dụng cho các trường hợp đơn giản như chỉ so sánh các mô hình với các hiệu ứng cố định khác nhau (tất nhiên là ước tính ML).
Giăng

Không, vấn đề này chỉ xuất hiện khi kiểm tra các thành phần phương sai, không phải các hiệu ứng cố định.
Aaron - Tái lập Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.