Ký hiệu cho mô hình đa cấp


10

Công thức người ta cần chỉ định để đào tạo một mô hình đa cấp (sử dụng lmertừ lme4 Rthư viện) luôn luôn giúp tôi. Tôi đã đọc vô số sách giáo khoa và hướng dẫn, nhưng không bao giờ hiểu đúng về nó.

Vì vậy, đây là một ví dụ từ hướng dẫn này mà tôi muốn thấy được xây dựng trong một phương trình. Chúng tôi đang cố gắng mô hình tần số giọng nói như một chức năng của giới tính (nữ giới có giọng nói cao hơn nam giới nói chung) và thái độ của người đó (cho dù anh ấy / cô ấy trả lời một cách lịch sự hoặc không chính thức) trong các tình huống khác nhau. Ngoài ra, như bạn có thể thấy từ subjectcột, mỗi người phải chịu các phép đo nhiều lần.

> head(politeness, n=20)
   subject gender scenario attitude frequency
1       F1      F        1      pol     213.3
2       F1      F        1      inf     204.5
3       F1      F        2      pol     285.1
4       F1      F        2      inf     259.7
5       F1      F        3      pol     203.9
6       F1      F        3      inf     286.9
7       F1      F        4      pol     250.8
8       F1      F        4      inf     276.8
9       F1      F        5      pol     231.9
10      F1      F        5      inf     252.4
11      F1      F        6      pol     181.2
12      F1      F        6      inf     230.7
13      F1      F        7      inf     216.5
14      F1      F        7      pol     154.8
15      F3      F        1      pol     229.7
16      F3      F        1      inf     237.3
17      F3      F        2      pol     236.8
18      F3      F        2      inf     251.0
19      F3      F        3      pol     267.0
20      F3      F        3      inf     266.0

subject, genderattitudelà những yếu tố (với informalfemaleđược coi là mức cơ sở cho attitudegendertrong các phương trình dưới đây). Bây giờ, một ý tưởng là đào tạo một mô hình với các lần chặn khác nhau cho mỗi subjectscenario:

politeness.model=lmer(frequency ~ attitude + gender + 
 (1|subject) + (1|scenario), data=politeness)

Nếu sự hiểu biết của tôi về ký hiệu là chính xác, thì điều này tương ứng với:

yi=aj[i]1+ak[i]2+β attitudepoli+γ gendermalei

nơi biểu thị điểm dữ liệu, biểu thị cấp độ nhóm cho và biểu thị cấp độ nhóm cho cho điểm dữ liệu. và là một chỉ số nhị phân.iithj[i]subjectk[i]scenarioithattitudepolgendermale

Để giới thiệu độ dốc ngẫu nhiên cho thái độ, chúng ta có thể viết:

politeness.model = lmer(frequency ~ attitude + gender + 
 (1+attitude|subject) + (1+attitude|scenario), data=politeness)

Một lần nữa, nếu sự hiểu biết của tôi là rõ ràng, điều này tương ứng với:

yi=aj[i]1+ak[i]2+(βj[i]1+βk[i]2) attitudepoli+γ gendermalei

Bây giờ, phương trình nào sau đây Rlệnh tương ứng?

politeness.null = lmer(frequency ~ gender +
 (1+attitude|subject) +  (1+attitude|scenario), data=politeness)

1
không phải là một điều rất hợp lý; độ dốc trung bình dân số liên quan đến thái độ được coi là bằng không ...
Ben Bolker 20/03/2016

@BenBolker: Này, bạn có thể vui lòng viết nó dưới dạng phương trình không? Các phương trình trước đây của tôi có đúng không? Trong mô hình cuối cùng, tôi vẫn thấy attitudeđược điều hòa subjectscenario.
abhinavkulkarni

Câu trả lời:


12

tôi sẽ viết

~ attitude + gender + (1|subject) + (1|scenario)

như

yiβ0+β1I(attitude=pol)+β2I(gender=male)+b1,j[i]+b2,k[i]+ϵib1N(0,σ12)b2N(0,σ22)ϵN(0,σr2)
trong đó chỉ ra hệ số hiệu ứng cố định, chỉ ra một biến ngẫu nhiên, là một hàm chỉ báo (về cơ bản giống như những gì bạn đã nói ở trên, chỉ khác một chút ký hiệu).βbI
~ attitude + gender + (1+attitude|subject) + (1+attitude|scenario)

thêm biến thể giữa các chủ đề để đáp ứng attitudescenario(chúng ta có thể viết tương ứng phần hiệu ứng ngẫu nhiên như (attitude|subject) + (attitude|scenario), nghĩa là bỏ mặc định chặn; đây là vấn đề của hương vị). Hiện nay

yiβ0+β1I(attitude=pol)+β2I(gender=male)+b1,j[i]+b3,j[i]I(attitude=pol)+b2,k[i]+b4,k[i]I(attitude=pol)+ϵi{b1,b3}MVN(0,Σ1){b2,b4}MVN(0,Σ2)ϵN(0,σr2)
nơi và là ma trận hiệp phương sai sai-không có cấu trúc, tức là họ đang đối xứng và tích cực (bán) xác định nhưng không có ràng buộc nào khác: và tương tự cho .Σ1Σ2
Σ1=(σ12σ13σ13σ32)
Σ2

Nó có thể được hướng dẫn theo các thuật ngữ nhóm như sau: để bạn có thể thấy những hiệu ứng ngẫu nhiên nào đang ảnh hưởng đến việc đánh chặn và ảnh hưởng nào đến phản ứng với thái độ.

yi(β0+b1,j[i]+b2,k[i])+(β1+b3,j[i]+b4,k[i])I(attitude=pol)+β2I(gender=male)+ϵi

Bây giờ nếu bạn bỏ attitudethuật ngữ hiệu ứng cố định (nghĩa là đặt hoặc bỏ thuật ngữ khỏi công thức), bạn có thể thấy (không cần viết lại mọi thứ), bởi vì các hiệu ứng ngẫu nhiên được coi là không có nghĩa, chúng tôi sẽ giả định rằng phản ứng trung bình đối với thái độ giữa các đối tượng và kịch bản sẽ chính xác bằng 0, trong khi vẫn có sự khác biệt giữa các đối tượng và kịch bản. Tôi sẽ không nói điều này không bao giờ có ý nghĩa từ quan điểm thống kê, nhưng nó hiếm khi làm điều đó. Thỉnh thoảng có các cuộc thảo luận về vấn đề này trên danh sách gửi thư r-sig-mixed-models@r-project.org ... (hoặc có thể được thảo luận trên StackExchange ở đâu đó - nếu không, nó sẽ làm tốt -trong câu hỏi SE ...)β1=0attitude

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.