Các câu hỏi về việc chỉ định mô hình hỗn hợp tuyến tính trong R cho dữ liệu đo lặp lại với cấu trúc lồng bổ sung


10

Cấu trúc dữ liệu

> str(data)
 'data.frame':   6138 obs. of  10 variables:
 $ RT     : int  484 391 422 516 563 531 406 500 516 578 ...
 $ ASCORE : num  5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ...
 $ HSCORE : num  6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ...
 $ MVMNT  : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2 1 2 1 1 2 ...
 $ STIM   : Factor w/ 123 levels " arti"," cele",..: 16 23 82 42 105 4 93 9 34 25 ...
 $ DRUG   : Factor w/ 2 levels "Inactive","Pharm": 1 1 1 1 1 1 1 1 1 1 ...
 $ FULLNSS: Factor w/ 2 levels "Fasted","Fed": 2 2 2 2 2 2 2 2 2 2 ...
 $ PATIENT: Factor w/ 25 levels "Subj01","Subj02",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ SESSION: Factor w/ 4 levels "Sess1","Sess2",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ TRIAL  : Factor w/ 6138 levels "T0001","T0002",..: 1 2 3 4 5 6 7 8 9 10 ...

Thí sinh mẫu đầy đủ

model.loaded.fit <- lmer(RT ~ ASCORE*HSCORE*MVMNT*DRUG*FULLNSS
                              + (1|PATIENT) + (1|SESSION), data, REML = TRUE)
  • Thời gian phản ứng từ các thử nghiệm được nhóm lại trong các phiên, lần lượt được nhóm lại trong bệnh nhân
  • Mỗi thử nghiệm có thể được đặc trưng bởi hai hiệp phương sai liên tục của ASCORE và HSCORE (trong khoảng từ 1-9) và bởi phản ứng chuyển động (rút hoặc tiếp cận)
  • Các phiên được đặc trưng bởi lượng thuốc (giả dược hoặc dược điển hoạt động) và đầy đủ (nhịn ăn hoặc cho ăn trước)

Mô hình hóa và R Cú pháp?

Tôi đang cố gắng chỉ định một mô hình đầy đủ thích hợp với cấu trúc trung bình được tải có thể được sử dụng làm điểm bắt đầu trong chiến lược lựa chọn mô hình từ trên xuống.

Vấn đề cụ thể:

  • Là cú pháp chỉ định chính xác các hiệu ứng phân cụm và ngẫu nhiên?
  • Ngoài cú pháp, mô hình này có phù hợp với thiết kế bên trong chủ đề không?
  • Mô hình đầy đủ có nên chỉ định tất cả các tương tác của các hiệu ứng cố định hay chỉ các hiệu ứng mà tôi thực sự quan tâm?
  • Tôi chưa bao gồm yếu tố STIM trong mô hình, đặc trưng cho loại kích thích cụ thể được sử dụng trong một thử nghiệm, nhưng tôi không quan tâm đến việc ước tính theo bất kỳ cách nào - tôi nên xác định rằng là một yếu tố ngẫu nhiên được đưa ra có 123 cấp độ và rất ít điểm dữ liệu trên mỗi loại kích thích?

Nếu tôi không thể tìm thấy lời khuyên ở đây tôi thực sự không biết tôi có thể hỏi ai? có thể bạn biết bất kỳ diễn đàn mô hình hỗn hợp chuyên dụng hoặc thậm chí một chuyên gia sẵn sàng tư vấn cho một ít tiền?
Cel

3
Xin chào @Cel, có vẻ như bạn đã có TẤT CẢ các tương tác trong mô hình, bao gồm các tương tác 5 chiều, 4 chiều và 3 chiều. Tôi không chắc chắn về trường hợp này, nhưng điều đó thường sẽ quá phù hợp với dữ liệu, điều này sẽ làm cho kết quả của bạn ít khái quát hơn. Lựa chọn lùi (nếu bạn phải sử dụng nó) không cần phải bắt đầu với một mô hình bão hòa hoàn toàn - nó nên bắt đầu với mô hình lớn nhất mà bạn thấy hợp lý. Bạn có thể giảm điều đó không?
Macro

@Macro thật tuyệt khi biết, tôi sẽ chỉ bao gồm các tương tác có vẻ hợp lý sau đó. Bạn có đề xuất về các vấn đề khác? nếu bạn làm thế, có thể đặt nó như một câu trả lời để tôi có thể chấp nhận nó.
Cel

Câu trả lời:


16

Tôi sẽ trả lời lần lượt từng câu hỏi của bạn.

Là cú pháp chỉ định chính xác các hiệu ứng phân cụm và ngẫu nhiên?

Mô hình bạn phù hợp ở đây, về mặt toán học, mô hình

Yijk=Xijkβ+ηi+θij+εijk

Ở đâu

  • Yijk là thời gian phản ứng để quan sát trong phiên trên cá nhân .kji

  • Xijk là vectơ dự đoán cho việc quan sát trong phiên trên cá nhân (trong mô hình bạn đã viết, nó bao gồm tất cả các hiệu ứng chính và tất cả các tương tác).kji

  • ηi là người hiệu ứng ngẫu nhiên tạo ra mối tương quan giữa các quan sát được thực hiện trên cùng một người. là hiệu ứng ngẫu nhiên cho phiên của cá nhân và là thuật ngữ lỗi còn sót lại.iθijijεijk

  • β là vectơ hệ số hồi quy.

Như đã lưu ý ở trang 14-15 ở đây , mô hình này là chính xác để chỉ định rằng các phiên được lồng trong các cá nhân, đó là trường hợp từ mô tả của bạn.

Ngoài cú pháp, mô hình này có phù hợp với thiết kế bên trong chủ đề không?

Tôi nghĩ mô hình này là hợp lý, vì nó tôn trọng cấu trúc lồng trong dữ liệu và tôi nghĩ rằng cá nhân và phiên được hình dung một cách hợp lý là các hiệu ứng ngẫu nhiên, như mô hình này khẳng định. Bạn nên xem xét mối quan hệ giữa các yếu tố dự đoán và phản hồi với các biểu đồ phân tán, v.v. để đảm bảo rằng công cụ dự đoán tuyến tính ( ) được chỉ định chính xác. Các chẩn đoán hồi quy tiêu chuẩn khác cũng có thể được kiểm tra.Xijkβ

Mô hình đầy đủ có nên chỉ định tất cả các tương tác của các hiệu ứng cố định hay chỉ các hiệu ứng mà tôi thực sự quan tâm?

Tôi nghĩ rằng bắt đầu với một mô hình bão hòa nặng nề như vậy có thể không phải là một ý tưởng tuyệt vời, trừ khi nó có ý nghĩa thực sự. Như tôi đã nói trong một bình luận, điều này sẽ có xu hướng phù hợp với tập dữ liệu cụ thể của bạn và có thể làm cho kết quả của bạn ít khái quát hơn. Về lựa chọn mô hình, nếu bạn bắt đầu với mô hình bão hòa hoàn toàn và thực hiện lựa chọn ngược ( mà một số người trên trang web này, với lý do chính đáng, phản đối ) thì bạn phải đảm bảo tôn trọng thứ bậc trong mô hình. Đó là, nếu bạn loại bỏ một tương tác cấp thấp hơn khỏi mô hình, thì bạn cũng nên xóa tất cả các tương tác cấp cao hơn liên quan đến biến đó. Để thảo luận thêm về điều đó, xem chủ đề được liên kết.

Tôi chưa bao gồm yếu tố STIM trong mô hình, đặc trưng cho loại kích thích cụ thể được sử dụng trong một thử nghiệm, nhưng tôi không quan tâm đến việc ước tính theo bất kỳ cách nào - tôi nên xác định rằng là một yếu tố ngẫu nhiên được đưa ra có 123 cấp độ và rất ít điểm dữ liệu trên mỗi loại kích thích?

Phải thừa nhận rằng không biết gì về ứng dụng (vì vậy hãy dùng nó với một hạt muối), nghe có vẻ như là một hiệu ứng cố định, không phải là một hiệu ứng ngẫu nhiên. Đó là, loại điều trị nghe có vẻ giống như một biến tương ứng với một sự thay đổi cố định trong đáp ứng trung bình, không phải là thứ gây ra mối tương quan giữa các đối tượng có cùng loại kích thích. Nhưng, thực tế rằng đó là một yếu tố cấp 123 làm cho nó trở nên cồng kềnh khi tham gia vào mô hình. Tôi cho rằng tôi muốn biết mức độ ảnh hưởng mà bạn mong đợi sẽ có. Bất kể kích thước của hiệu ứng là bao nhiêu, nó sẽ không gây ra sai lệch trong ước tính độ dốc của bạn vì đây là mô hình tuyến tính, nhưng bỏ qua nó có thể làm cho các lỗi tiêu chuẩn của bạn lớn hơn so với bình thường.


2
ồ cảm ơn Macro, tôi ước tôi có thể cho nhiều điểm hơn.
Cel

Vì các hiệu ứng ngẫu nhiên được giao nhau thay vì ngẫu nhiên, nên ký hiệu phải là và (chứ không phải là ), vì kể từ khi được giao (và không được lồng) với bệnh nhân? ηiθjθj
Joshua Rosenberg
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.