Tôi có chỉ định chính xác mô hình lmer của tôi không?


9

Tôi đã truy quét Google và trang web này và tôi vẫn còn bối rối về chức năng lmer trong thư viện lme4.

Tôi có một số dữ liệu được thu thập từ các phường tâm thần khác nhau, có cấu trúc đa cấp độ. Để đơn giản hóa, tôi sẽ chọn hai biến cấp 2 và hai cấp 1, mặc dù tôi thực sự có thêm một vài biến.

Cấp 2- WardSize [đây là số người trong phường] & WAS [đây là thước đo mức độ "tốt đẹp" của phường]

Biến nhóm cho R biết trong phường nào được gọi là "Ward"

Cấp một - Giới tính [đây là giới tính, rõ ràng] & BSITotal [đây là thước đo mức độ nghiêm trọng của triệu chứng]

Kết quả là Selfreject, một lần nữa là những gì nó nghe như.

Tôi có công thức này:

help = lmer (công thức = Selfreject ~ WardSize + WAS + Giới tính + BSITotal + (1 | Ward))

Tôi hy vọng điều này có nghĩa là "mỗi cá nhân có một số điểm liên quan đến Giới tính và mức độ nghiêm trọng của triệu chứng của chính họ, và cũng là một hiệu ứng cấp phường liên quan đến quy mô của phường và mức độ" tốt đẹp "của nó"

Điều này có đúng không? Điều khiến tôi bối rối là tôi không thể thấy R có thể biết được mức nào là biến số cấp 1 và cấp độ 2, ngoại trừ việc chặn cấp phường được đưa ra ở cuối.

Nếu bất cứ ai có thể giải thích ký hiệu để một kẻ ngốc như tôi có thể hiểu điều đó sẽ còn tốt hơn.

Cảm ơn nhiều!

Câu trả lời:


11

Đặc điểm kỹ thuật mô hình của bạn là tốt.

Việc chặn khác nhau đối với Ward, được chỉ định trong lmer như bạn đã thực hiện với (1 | Ward), nói rằng các đối tượng trong mỗi phường có thể giống nhau hơn trên Selfreject vì các lý do khác với WardSize hoặc Giới tính, do đó bạn đang kiểm soát giữa các phường không đồng nhất.

Bạn có thể nghĩ "1" là một cột 1s (tức là hằng số) trong dữ liệu mà một phần chặn phù hợp. Thông thường, "1" được ngụ ý tự động trong lm, ví dụ

lm(Y ~ X1 + X2)

thực sự chỉ định

lm(Y ~ 1 + X1 + X2)

Bây giờ bạn đã có mô hình cơ bản của mình, bạn có thể bắt đầu hỏi thêm các câu hỏi như "Mối quan hệ giữa BSItotal và Selfreject có khác nhau giữa các phường không?"

lmer(formula=Selfreject ~ WardSize + WAS + Gender + BSITotal + (1 + BSITotal | Ward))

Đó là, cả phần chặn và độ dốc của BSITotal có thể khác nhau giữa các phường.

Nếu bạn chưa chọn nó, Phân tích dữ liệu của Gelman & Hill sử dụng mô hình hồi quy và mô hình đa cấp / mô hình phân cấp là một cuốn sách tuyệt vời giải thích các mô hình phù hợp như thế này với độ sáng hơn.


1

Đây là một liên kết đến một lời giải thích của Douglas Bates (người đã viết lme4) về lý do tại sao không cần thiết phải chỉ định mức độ cho các hiệu ứng cố định.


2
Chào mừng đến với trang web, @Breyer. Tôi nghi ngờ đây là một đóng góp hữu ích. Bạn có phiền khi đưa ra một bản tóm tắt ngắn gọn về cuộc tranh luận ở đó, để người đọc có thể quyết định xem đó là những gì họ đang tìm kiếm, hoặc trong trường hợp liên kết trong tương lai?
gung - Phục hồi Monica

2
Cảm ơn đã chào đón @gung. Chắc chắn, Bates giải thích rằng không cần thiết phải chỉ định các mức cho các hiệu ứng cố định vì gói lme4 được viết cho các mô hình hỗn hợp, bao gồm nhưng không giới hạn ở các mô hình đa cấp / phân cấp. Điều này có nghĩa là các phương pháp tính toán không dựa vào đặc điểm kỹ thuật của các mức, như trường hợp của phần mềm hồi quy đa cấp chuyên dụng (HLM, v.v.) tận dụng cấu trúc dữ liệu lồng nhau trong tính toán.
Breyer
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.