Điều gì sẽ là một hình ảnh minh họa cho các mô hình hỗn hợp tuyến tính?


17

Giả sử bạn đang ở trong thư viện của khoa thống kê và bạn bắt gặp một cuốn sách có hình ảnh sau ở trang đầu.

nhập mô tả hình ảnh ở đây

Bạn có thể sẽ nghĩ rằng đây là một cuốn sách về những điều hồi quy tuyến tính.

Điều gì sẽ là bức tranh khiến bạn nghĩ về các mô hình hỗn hợp tuyến tính?

Câu trả lời:


12

Để nói chuyện, tôi đã sử dụng hình ảnh sau đây dựa trên sleepstudybộ dữ liệu từ gói lme4 . Ý tưởng là để minh họa sự khác biệt giữa hồi quy độc lập phù hợp với dữ liệu cụ thể theo chủ đề (màu xám) so với dự đoán từ các mô hình hiệu ứng ngẫu nhiên, đặc biệt là (1) giá trị dự đoán từ mô hình hiệu ứng ngẫu nhiên là ước lượng co rút và (2) chia sẻ quỹ đạo cá nhân độ dốc chung với mô hình chỉ đánh chặn ngẫu nhiên (màu cam). Các bản phân phối của các chủ đề chặn được hiển thị dưới dạng ước tính mật độ hạt nhân trên trục y ( mã R ).

nhập mô tả hình ảnh ở đây
(Các đường cong mật độ mở rộng ra ngoài phạm vi của các giá trị được quan sát vì có tương đối ít quan sát.)

Một hình ảnh 'thông thường' hơn có thể là hình ảnh tiếp theo, từ Doug Bates (có sẵn trên trang R-forge cho lme4 , ví dụ 4Longitudinal.R ), nơi chúng tôi có thể thêm dữ liệu riêng lẻ vào mỗi bảng.

nhập mô tả hình ảnh ở đây


+1. Tốt một! Tôi nghĩ rằng cốt truyện đầu tiên của bạn là tuyệt vời ở cấp độ khái niệm. Nhận xét duy nhất của tôi là nó đòi hỏi giải thích nhiều hơn đáng kể so với cốt truyện "ngây thơ" tiêu chuẩn và nếu khán giả không theo kịp các khái niệm về mô hình LME và dữ liệu theo chiều dọc thì nó có thể bỏ lỡ điểm của cốt truyện. Tôi chắc chắn sẽ nhớ nó cho một "số liệu thống kê" vững chắc mặc dù. (Tôi đã nhìn thấy những âm mưu thứ hai trong "Cuốn sách lme4" một vài lần tôi đã không quá ấn tượng sau đó và tôi không quá ấn tượng tại một trong hai..)
usεr11852 nói Khôi phục Monic

@chl: Cảm ơn! Tôi sẽ chọn trong số các đề xuất. Trong khi đó, +1
ocram

@ user11852 Sự hiểu biết của tôi về mô hình RI là các ước tính OLS là chính xác, nhưng các lỗi tiêu chuẩn của chúng không phải (vì thiếu tính độc lập) nên các dự đoán riêng lẻ cũng sẽ không chính xác. Thông thường, tôi sẽ chỉ ra đường hồi quy tổng thể giả định các quan sát độc lập. Sau đó, lý thuyết cho chúng ta biết rằng việc kết hợp các chế độ có điều kiện của các hiệu ứng ngẫu nhiên và ước tính của các hiệu ứng cố định sẽ tạo ra các chế độ có điều kiện của các hệ số bên trong chủ đề, và sẽ có ít sự chênh lệch khi các đơn vị thống kê khác nhau, hoặc khi các phép đo chính xác, hoặc với mẫu lớn.
chl

y|γN(Xβ+Zγ,σ2I)yN(Xβ,ZDZT+σ2I)

Liên kết đến mã R để tạo ảnh bị hỏng. Tôi sẽ quan tâm đến cách vẽ các bản phân phối theo chiều dọc trong hình.
Niels Hameleers

8

Vì vậy, một cái gì đó không "cực kỳ thanh lịch" nhưng lại hiển thị các giao thoa ngẫu nhiên và dốc quá với R. (Tôi đoán nó sẽ còn tuyệt hơn nữa nếu được hiển thị các phương trình thực tế) nhập mô tả hình ảnh ở đây

N =100; set.seed(123);


x1 = runif(N)*3; readings1 <- 2*x1 + 1.0 + rnorm(N)*.99;
x2 = runif(N)*3; readings2 <- 3*x2 + 1.5 + rnorm(N)*.99;
x3 = runif(N)*3; readings3 <- 4*x3 + 2.0 + rnorm(N)*.99;
x4 = runif(N)*3; readings4 <- 5*x4 + 2.5 + rnorm(N)*.99;
x5 = runif(N)*3; readings5 <- 6*x5 + 3.0 + rnorm(N)*.99;

X = c(x1,x2,x3,x4,x5);
Y = c(readings1,readings2,readings3,readings4,readings5)
Grouping  = c(rep(1,N),rep(2,N),rep(3,N),rep(4,N),rep(5,N))

library(lme4);
LMERFIT <- lmer(Y ~ 1+ X+ (X|Grouping))

RIaS <-unlist( ranef(LMERFIT)) #Random Intercepts and Slopes
FixedEff <- fixef(LMERFIT)    # Fixed Intercept and Slope

png('SampleLMERFIT_withRandomSlopes_and_Intercepts.png', width=800,height=450,units="px" )
par(mfrow=c(1,2))
plot(X,Y,xlab="x",ylab="readings")
plot(x1,readings1, xlim=c(0,3), ylim=c(min(Y)-1,max(Y)+1), pch=16,xlab="x",ylab="readings" )
points(x2,readings2, col='red', pch=16)
points(x3,readings3, col='green', pch=16)
points(x4,readings4, col='blue', pch=16)
points(x5,readings5, col='orange', pch=16)
abline(v=(seq(-1,4 ,1)), col="lightgray", lty="dotted");        
abline(h=(seq( -1,25 ,1)), col="lightgray", lty="dotted")   

lines(x1,FixedEff[1]+ (RIaS[6] + FixedEff[2])* x1+ RIaS[1], col='black')
lines(x2,FixedEff[1]+ (RIaS[7] + FixedEff[2])* x2+ RIaS[2], col='red')
lines(x3,FixedEff[1]+ (RIaS[8] + FixedEff[2])* x3+ RIaS[3], col='green')
lines(x4,FixedEff[1]+ (RIaS[9] + FixedEff[2])* x4+ RIaS[4], col='blue')
lines(x5,FixedEff[1]+ (RIaS[10]+ FixedEff[2])* x5+ RIaS[5], col='orange') 
legend(0, 24, c("Group1","Group2","Group3","Group4","Group5" ), lty=c(1,1), col=c('black','red', 'green','blue','orange'))
dev.off()

Cảm ơn! Tôi chờ thêm một chút để có câu trả lời mới tiềm năng ... nhưng tôi có thể dựa vào câu trả lời này.
ocram

Tôi hơi bối rối bởi con số của bạn, bởi vì subplot bên phải nhìn tôi như thể đường hồi quy riêng biệt phù hợp với từng nhóm. Không phải toàn bộ quan điểm rằng sự phù hợp của mô hình hỗn hợp nên khác với sự phù hợp của từng nhóm độc lập sao? Có lẽ họ là như vậy, nhưng trong ví dụ này thực sự rất khó để nhận ra, hoặc tôi đang thiếu một cái gì đó?
amip nói rằng Phục hồi Monica

2
Có, hệ số là khác nhau . Không; một hồi quy riêng biệt không phù hợp với từng nhóm. Các điều kiện phù hợp được hiển thị. Trong một thiết kế cân bằng hoàn hảo, đồng nhất vì đây là điểm khác biệt sẽ khó nhận thấy, ví dụ, khả năng đánh chặn có điều kiện của nhóm 5 là 2,96 trong khi tỷ lệ chặn mỗi nhóm độc lập là 3,00. Đây là cấu trúc hiệp phương sai lỗi mà bạn đang thay đổi. Kiểm tra câu trả lời của chi quá, nó có nhiều nhóm hơn nhưng thậm chí có rất ít trường hợp phù hợp là "rất khác nhau" về mặt trực quan.
usεr11852 nói Phục hồi Monic

6

Không phải việc của tôi

Biểu đồ này được lấy từ tài liệu Matlab của nlmefit gây ấn tượng với tôi như một người thực sự minh họa cho khái niệm về các đòn đánh ngẫu nhiên và độ dốc khá rõ ràng. Có lẽ một cái gì đó cho thấy các nhóm không đồng nhất trong phần dư của âm mưu OLS cũng khá chuẩn nhưng tôi sẽ không đưa ra "giải pháp".


Cảm ơn lời đề nghị của bạn. Mặc dù nó trông giống như những thứ hồi quy logistic hỗn hợp, tôi đoán tôi có thể dễ dàng thích nghi với nó. Tôi chờ đợi thêm gợi ý. Trong khi đó, +1. Cảm ơn một lần nữa.
ocram

Có vẻ như một hồi quy logistic hỗn hợp chủ yếu là vì nó là một ... :) Đó là cốt truyện đầu tiên xuất hiện trong tâm trí tôi! Tôi sẽ đưa ra một cái gì đó hoàn toàn R-ish trong câu trả lời thứ hai.
usεr11852 nói Phục hồi Monic
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.