Tại sao các mô hình hiệu ứng hỗn hợp giải quyết sự phụ thuộc?


14

Giả sử chúng tôi quan tâm đến việc điểm thi của học sinh bị ảnh hưởng như thế nào bởi số giờ học của những học sinh đó. Để khám phá mối quan hệ này, chúng ta có thể chạy hồi quy tuyến tính sau:

exam.gradesi=a+β1×hours.studiedi+ei

Nhưng nếu chúng ta lấy mẫu học sinh từ một số trường khác nhau, chúng ta có thể mong đợi học sinh trong cùng một trường giống nhau hơn so với học sinh từ các trường khác nhau. Để giải quyết vấn đề phụ thuộc này, lời khuyên trong nhiều sách giáo khoa / trên web, là chạy một hiệu ứng hỗn hợp và vào trường như một hiệu ứng ngẫu nhiên. Vì vậy, mô hình sẽ trở thành:

exam.gradesi=a+β1×hours.studiedi+schoolj+ei
Nhưng tại sao điều này giải quyết vấn đề phụ thuộc mà đã có mặt trong hồi quy tuyến tính?

Hãy trả lời như thể bạn đang nói chuyện với một đứa trẻ 12 tuổi


Cho dù nó "giải quyết" vấn đề phụ thuộc là bối cảnh cụ thể. Nhưng bạn có thể thấy rằng bây giờ mô hình mở rộng có một thuật ngữ, ít nhất là một phần, chiếm một hiệu ứng liên quan đến một trường cụ thể.
image_doctor

Câu trả lời:


23

Bao gồm các thuật ngữ ngẫu nhiên trong mô hình là một cách để tạo ra một số cấu trúc hiệp phương sai bteween các lớp. Yếu tố ngẫu nhiên cho trường học tạo ra một hiệp phương sai khác không giữa các sinh viên khác nhau từ cùng một trường, trong khi đó là khi trường khác nhau.0

Hãy viết mô hình của bạn dưới dạng trong đó s lập chỉ mục trường và tôi lập chỉ mục cho học sinh (ở mỗi trường). Các thuật ngữ học s là các biến ngẫu nhiên độc lập rút ra trong một N ( 0 , τ ) . Các e s , i là các biến độc lập ngẫu nhiên rút ra trong một N ( 0 , σ

Ys,i=α+hourss,iβ+schools+es,i
sischoolsN(0,τ)es,i .N(0,σ2)

Vectơ này có giá trị mong đợi được xác định bởi số giờ làm việc.

[α+hourss,iβ]s,i

Hiệp phương sai giữa Y s ' , i '0 khi s s ' , có nghĩa là sự ra đi của các lớp từ các giá trị dự kiến là độc lập khi các sinh viên đang không ở trong cùng một trường.Ys,iYs,i0ss

Hiệp phương sai giữa Y s , i 'τ khi i i ' , và phương sai của Y s , iτ + σ 2 : lớp của sinh viên đến từ trường tương tự sẽ có tương quan khởi hành từ các giá trị mong đợi của họ .Ys,iYs,iτiiYs,iτ+σ2

Ví dụ và dữ liệu mô phỏng

Đây là một mô phỏng R viết tắt của năm mươi sinh viên đến từ năm trường (ở đây tôi lấy ); tên của biến là tài liệu tự: σ2=τ=1

set.seed(1)
school        <- rep(1:5, each=10)
school_effect <- rnorm(5)

school_effect_by_ind <- rep(school_effect, each=10)
individual_effect    <- rnorm(50)

schools+es,i

plot(individual_effect + school_effect_by_ind, col=school, pch=19, 
     xlab="student", ylab="grades departure from expected value")
segments(seq(1,length=5,by=10), school_effect, seq(10,length=5,by=10), col=1:5, lty=3)

mô hình hỗn hợp

schoolsα+hoursβ

Ma trận phương sai cho ví dụ này

schoolses,i

[A00000A00000A00000A00000A]
10×10A
A=[2111111111121111111111211111111112111111111121111111111211111111112111111111121111111111211111111112].

1
Elvis: đó có lẽ là một câu trả lời tuyệt vời cho những người thông thạo thống kê hơn tôi. Tuy nhiên tôi có thể rút ra rất ít ý nghĩa từ nó. Bạn có thể chỉnh sửa câu trả lời của mình theo cách mà một đứa trẻ 12 tuổi có thể hiểu được không?
luciano

1
Một ... 12 tuổi?! Ồ Tôi sẽ thêm một số mô phỏng, nếu điều này có thể giúp đỡ.
Elvis

5
Làm xong. Hi vọng điêu nay co ich. Nếu không, xin vui lòng cụ thể hơn về những gì bạn không nhận được. Lưu ý rằng 12 yo cũng sẽ không hiểu câu hỏi ... bạn không thể yêu cầu câu trả lời đơn giản hơn câu hỏi.
Elvis
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.