Các câu hỏi về cách hiệu ứng ngẫu nhiên được chỉ định trong lmer


55

Gần đây tôi đã đo lường ý nghĩa của một từ mới có được như thế nào đối với các mức phơi nhiễm lặp đi lặp lại (thực hành: ngày 1 đến ngày 10) bằng cách đo lường ERP (EEG) khi từ này được xem trong các ngữ cảnh khác nhau. Tôi cũng kiểm soát các thuộc tính của bối cảnh, ví dụ, tính hữu ích của nó đối với việc khám phá nghĩa mới của từ (cao so với thấp). Tôi đặc biệt quan tâm đến hiệu quả của thực hành (ngày). Bởi vì các bản ghi ERP riêng lẻ rất ồn, giá trị thành phần ERP có được bằng cách lấy trung bình qua các thử nghiệm của một điều kiện cụ thể. Với lmerchức năng, tôi áp dụng công thức sau:

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

Tôi cũng đã thấy tương đương với các hiệu ứng ngẫu nhiên sau đây trong tài liệu:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Điều gì được thực hiện bằng cách sử dụng một yếu tố ngẫu nhiên của mẫu participants:context? Có một nguồn tốt nào cho phép những người chỉ có kiến ​​thức về đại số ma trận hiểu chính xác các yếu tố ngẫu nhiên làm gì trong các mô hình hỗn hợp tuyến tính và làm thế nào để chọn chúng?

Câu trả lời:


77

Tôi sẽ mô tả mô hình của mỗi cuộc gọi của bạn để lmer()phù hợp và cách chúng khác nhau và sau đó trả lời câu hỏi cuối cùng của bạn về việc chọn hiệu ứng ngẫu nhiên.

Mỗi một trong ba mô hình của bạn chứa các hiệu ứng cho cố định practice, contextvà sự tương tác giữa hai người. Các hiệu ứng ngẫu nhiên khác nhau giữa các mô hình.

lmer(ERPindex ~ practice*context + (1|participants), data=base) 

chứa một chặn ngẫu nhiên được chia sẻ bởi các cá nhân có cùng giá trị cho participants. Nghĩa là, participantđường hồi quy của mỗi dòng được dịch chuyển lên / xuống theo một lượng ngẫu nhiên với giá trị trung bình là .0

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base) 

Mô hình này, ngoài việc đánh chặn ngẫu nhiên, còn chứa một độ dốc ngẫu nhiên trong practice. Điều này có nghĩa là tốc độ cá nhân học từ thực tiễn là khác nhau từ người này sang người khác. Nếu một cá nhân có hiệu ứng ngẫu nhiên tích cực, thì họ tăng nhanh hơn với thực hành so với trung bình, trong khi hiệu ứng ngẫu nhiên tiêu cực cho thấy họ học ít hơn với thực hành so với trung bình, hoặc có thể trở nên tồi tệ hơn với thực tiễn, tùy thuộc vào phương sai của ngẫu nhiên hiệu ứng (đây là giả định hiệu quả cố định của thực hành là tích cực).

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Mô hình này phù hợp với độ dốc ngẫu nhiên và đánh chặn practice(bạn phải thực hiện (practice-1|...)để triệt tiêu chặn), giống như mô hình trước đó đã làm, nhưng bây giờ bạn cũng đã thêm độ dốc ngẫu nhiên và đánh chặn trong yếu tố participants:context, đây là một yếu tố mới có cấp độ là mọi sự kết hợp của các cấp có trong participantscontextvà các hiệu ứng ngẫu nhiên tương ứng được chia sẻ bởi các quan sát có cùng giá trị của cả hai participantscontext. Để phù hợp với mô hình này, bạn sẽ cần có nhiều quan sát có cùng giá trị cho cả hai participantscontextnếu không thì mô hình không thể ước tính được. Trong nhiều tình huống, các nhóm được tạo bởi biến tương tác này rất thưa thớt và dẫn đến các mô hình hiệu ứng ngẫu nhiên rất ồn / khó phù hợp, vì vậy bạn muốn cẩn thận khi sử dụng một yếu tố tương tác làm biến nhóm.

Về cơ bản (đọc: không quá phức tạp) nên sử dụng các hiệu ứng ngẫu nhiên khi bạn nghĩ rằng các biến nhóm được định nghĩa "các túi" không đồng nhất trong tập dữ liệu hoặc các cá nhân có chung mức độ của yếu tố nhóm nên tương quan với nhau (trong khi các cá nhân không nên không tương quan) - các hiệu ứng ngẫu nhiên thực hiện điều này. Nếu bạn nghĩ rằng các quan sát chia sẻ mức độ của cả hai participantscontextgiống nhau hơn tổng của hai phần thì bao gồm cả hiệu ứng ngẫu nhiên "tương tác" có thể phù hợp.

Chỉnh sửa: Như @Henrik đề cập trong các nhận xét, các mô hình bạn phù hợp, ví dụ:

lmer(ERPindex ~ practice*context + (1+practice|participants), data=base)

làm cho nó để độ dốc ngẫu nhiên và đánh chặn ngẫu nhiên có mối tương quan với nhau và mối tương quan đó được ước tính bởi mô hình. Để hạn chế mô hình sao cho độ dốc ngẫu nhiên và chặn ngẫu nhiên không tương quan (và do đó độc lập, vì chúng được phân phối bình thường), thay vào đó, bạn phù hợp với mô hình:

lmer(ERPindex ~ practice*context + (1|participants) + (practice-1|participants), 
     data=base)

Sự lựa chọn giữa hai điều này nên dựa trên việc bạn nghĩ, ví dụ, participants có đường cơ sở cao hơn trung bình (tức là đánh chặn ngẫu nhiên dương) cũng có khả năng có tỷ lệ thay đổi cao hơn trung bình (tức là độ dốc ngẫu nhiên dương). Nếu vậy, bạn sẽ cho phép hai người tương quan với nhau trong khi nếu không, bạn sẽ buộc họ phải độc lập. (Một lần nữa, ví dụ này giả định độ dốc hiệu ứng cố định là dương).


2
Tôi không muốn kén chọn, nhưng không phải mô hình thứ hai cũng chứa mối tương quan giữa phần chặn và độ dốc. Chỉ cần thêm các sườn nên là: lmer(ERPindex ~ practice*context + (1|participants) + (0 + practice|participants, data=base)Hay tôi sai? (Không liên quan: Xin lỗi vì bài chỉnh sửa nhỏ của tôi về bài đăng của bạn. Nếu bạn không đồng ý với việc làm rõ, chỉ cần thay đổi lại)
Henrik

@Henrik, vâng, bạn đúng rằng nó cũng ước tính mối tương quan giữa hai hiệu ứng ngẫu nhiên. Khi viết câu trả lời này, tôi đã cố gắng đưa ra một ý tưởng "bức tranh lớn" về những gì đang xảy ra với các mô hình này, trong đó không bao gồm việc đề cập đến mối tương quan giữa các hiệu ứng ngẫu nhiên, không có mô tả "hai xu" đơn giản cách dốc và đánh chặn làm :) Trong mọi trường hợp, tôi không nghĩ thiếu sót này làm cho việc giải thích tôi đã làm trong câu trả lời của tôi không chính xác. BTW, cảm ơn đã chỉnh sửa.
Macro

1
@Henrik, tôi đã thêm một lưu ý về sự khác biệt giữa việc tạo ra các hiệu ứng ngẫu nhiên tương quan so với không tương quan mà tôi nghĩ là cải thiện câu trả lời - cảm ơn vì đã chỉ ra nó.
Macro

Cảm ơn. Tôi đang cố gắng tham gia vào mô hình hỗn hợp và cũng đang vật lộn với câu hỏi về cách thức và thời điểm sử dụng cấu trúc hiệu ứng ngẫu nhiên nào, mà tôi chỉ muốn chắc chắn. Tóm lại, câu trả lời tuyệt vời (+1).
Henrik

1
@pom, cảm ơn bạn đã khen. Re: nhận xét của bạn, tôi đã kiểm tra điều này trên dữ liệu mô phỏng và tôi nghĩ rằng bạn có nó ngược. Mô hình thứ hai theo chỉnh sửa của tôi có ít tham số hơn mô hình đầu tiên. Điều này là do mô hình thứ hai hạn chế mối tương quan giữa hai hiệu ứng ngẫu nhiên bằng không. Khác hơn là các mô hình là như nhau. Tôi không chắc chắn những gì bạn gặp phải nhưng một ví dụ có thể tái tạo sẽ giúp ích. Đây là của tôi:x <-rnorm(1000); id <- rep(1:100,each=10); y <- rnorm(1000); g <- lmer(y ~ (1+x|id)); g2 <- lmer(y ~ (1|id) + (x-1|id)); attr(logLik(g),"df"); attr(logLik(g2),"df");
Macro

13

@Macro đã đưa ra một câu trả lời tốt ở đây, tôi chỉ muốn thêm một điểm nhỏ. Nếu một số người trong tình huống của bạn đang sử dụng:

lmer(ERPindex ~ practice*context + (practice|participants) + 
                (practice|participants:context), data=base) 

Tôi nghi ngờ họ đang phạm sai lầm. Xem xét: (practice|participants)có nghĩa là có độ dốc ngẫu nhiên (và đánh chặn) cho hiệu ứng của practicetừng độ dốc participant, trong khi đó (practice|participants:context)có nghĩa là có độ dốc ngẫu nhiên (và chặn) cho hiệu ứng của practicetừng participant by context kết hợp . Điều này tốt, nếu đó là những gì họ muốn, nhưng tôi nghi ngờ họ muốn (practice:context|participants), điều đó có nghĩa là có một độ dốc ngẫu nhiên (và đánh chặn) cho hiệu ứng tương tác của practice by contexttừng loại participant.


4

Trong một mô hình hiệu ứng ngẫu nhiên hoặc hiệu ứng hỗn hợp, một hiệu ứng ngẫu nhiên được sử dụng khi bạn muốn xử lý hiệu ứng mà bạn quan sát thấy như thể nó được rút ra từ một số phân phối xác suất của hiệu ứng.

Một trong những ví dụ tốt nhất tôi có thể đưa ra là khi mô hình hóa dữ liệu thử nghiệm lâm sàng từ một thử nghiệm lâm sàng đa trung tâm. Một hiệu ứng trang web thường được mô hình hóa như một hiệu ứng ngẫu nhiên. Điều này được thực hiện bởi vì khoảng 20 trang web thực sự được sử dụng trong thử nghiệm đã được rút ra từ một nhóm các trang web tiềm năng lớn hơn nhiều. Trong thực tế, lựa chọn có thể không phải là ngẫu nhiên, nhưng nó vẫn có thể hữu ích để đối xử với nó như thể nó là.

Mặc dù hiệu ứng trang web có thể được mô hình hóa thành hiệu ứng cố định, nhưng thật khó để khái quát kết quả cho dân số lớn hơn nếu chúng ta không tính đến thực tế là hiệu ứng cho một bộ 20 trang web được chọn khác nhau sẽ khác nhau. Đối xử với nó như một hiệu ứng ngẫu nhiên cho phép chúng ta giải thích nó theo cách đó.


1
-1 vì câu trả lời này không giải quyết các câu hỏi thực tế ở đây.
amip nói rằng Phục hồi lại
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.