REML vs ML stepAIC


10

Tôi cảm thấy choáng ngợp sau khi cố gắng nghiên cứu tài liệu về cách chạy phân tích mô hình hỗn hợp của mình sau khi sử dụng AIC để chọn mô hình hoặc mô hình tốt nhất. Tôi không nghĩ dữ liệu của mình phức tạp đến thế, nhưng tôi đang tìm kiếm xác nhận rằng những gì tôi đã làm là chính xác, và sau đó tư vấn về cách tiến hành. Tôi không chắc là tôi nên sử dụng lme hay lmer và sau đó với một trong hai, nếu tôi nên sử dụng REML hoặc ML.

Tôi có một giá trị của lựa chọn và tôi muốn biết cái nào đồng biến ảnh hưởng tốt nhất đến giá trị đó và cho phép dự đoán. Đây là một số dữ liệu ví dụ và mã cho bài kiểm tra của tôi mà tôi đang làm việc với:

ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)

Tôi có ~ 19 mô hình khám phá dữ liệu này với các kết hợp khác nhau và lên đến thuật ngữ tương tác 2 chiều, nhưng luôn có ID là hiệu ứng ngẫu nhiên và comp1 là biến phụ thuộc của tôi.

  • Q1. Dùng loại nào? lme hay lmer? có vấn đề gì không

Trong cả hai điều này, tôi có tùy chọn sử dụng ML hoặc REML - và tôi nhận được các câu trả lời khác nhau - sử dụng ML theo sau là AIC Tôi kết thúc với 6 mô hình với tất cả các giá trị AIC tương tự và các kết hợp mô hình đơn giản là không có ý nghĩa, trong khi REML kết quả trong 2 mô hình rất có thể là tốt nhất. Tuy nhiên, khi chạy REML tôi không thể sử dụng anova nữa.

  • Quý 2 là lý do chính để sử dụng ML trên REML vì sử dụng với ANOVA? Điều này không rõ ràng với tôi.

Tôi vẫn không thể chạy stepAIC hoặc tôi không biết cách nào khác để thu hẹp 19 mô hình đó.

  • H3 Có cách nào để sử dụng stepAIC vào thời điểm này không?

3
Đối với Q2, ML là cần thiết vì các so sánh sử dụng REML không hợp lệ khi các hiệu ứng cố định thay đổi. Một câu hỏi hữu ích liên quan có thể có ở đây: stats.stackexchange.com/a/16015/3601
Aaron rời khỏi Stack Overflow

@Aaron Tôi đã xem câu hỏi đó trước đây, nhưng vẫn còn bối rối. Chỉ sử dụng REML "hoạt động" khi hiệu ứng ngẫu nhiên thay đổi? Tôi rõ ràng không hiểu đủ về ML vs REML. Cảm ơn, mặc dù điều đó giúp với một trong những câu hỏi của tôi!
Kerry

Vâng, đó là chính xác. Khi so sánh các mô hình, chỉ nên sử dụng REML nếu các mô hình có cùng hiệu ứng cố định. Câu trả lời mở rộng dưới đây.
Aaron rời Stack Overflow

Câu trả lời:


16

Q1. Dùng loại nào? lme hay lmer? có vấn đề gì không Hoặc là tốt. Họ sẽ cung cấp cho bạn phù hợp với cùng. lmesẽ cung cấp cho bạn giá trị p, và lmersẽ không, nhưng đó là nhiều hơn tôi muốn vào đây. Tài liệu tham khảo nổi tiếng nhất là một trong những bài đăng của Doug Bates trong danh sách gửi thư của R-help tại đây .

(caveat: Họ làm sử dụng các thuật toán hơi khác nhau nên có những trường hợp có khả năng một số tính toán khó khăn mà người ta hay cách khác có thể làm tốt hơn, nhưng đó là rất hiếm trong thực tế, và thực sự, nhiều khả năng điểm đến một số loại mô hình thông số sai lệch See. Hoàn toàn khác nhau kết quả từ lmer () và lme () .)

Quý 2 là lý do chính để sử dụng ML trên REML vì sử dụng với ANOVA? Điều này không rõ ràng với tôi. ML là cần thiết vì các so sánh sử dụng REML không hợp lệ khi các hiệu ứng cố định thay đổi. Một câu hỏi hữu ích liên quan có thể có ở đây: https://stats.stackexchange.com/a/16015/3601 . Để trả lời câu hỏi của bạn trong nhận xét ở trên, có, khi so sánh các mô hình, chỉ nên sử dụng REML nếu các mô hình có cùng hiệu ứng cố định (nghĩa là khi chỉ có các hiệu ứng ngẫu nhiên thay đổi). Khả năng REML phụ thuộc vào hiệu ứng cố định nào trong mô hình và do đó không thể so sánh được nếu hiệu ứng cố định thay đổi. Tuy nhiên, REML thường được coi là đưa ra ước tính tốt hơn cho các hiệu ứng ngẫu nhiên, do đó, lời khuyên thông thường là phù hợp với mô hình tốt nhất của bạn bằng cách sử dụng REML cho suy luận và báo cáo cuối cùng của bạn.

H3 Có cách nào để sử dụng stepAIC vào thời điểm này không? Để so sánh giữa 19 mô hình của bạn có ý nghĩa trong tình huống của bạn, chỉ cần so sánh AIC cho tất cả chúng. Không có lý do để sử dụng một thủ tục từng bước ở tất cả. Các quy trình từng bước thường được xem là lỗi thời vì chúng không đảm bảo rằng mô hình tốt nhất được tìm thấy và máy tính giúp dễ dàng so sánh nhiều mô hình.


1

Trong quá trình đào sâu hơn, tôi cũng đã tìm thấy những tài nguyên sao lưu các liên kết mà Aaron đã cung cấp và là những bài đọc tốt cho những người bắt đầu như tôi. Các chương được liên kết trên http://lme4.r-forge.r-project.org/ để biết ví dụ kiểm tra liên kết slide http://lme4.r-forge.r-project.org/slides/ trên cùng trang dự án . Nhiều khóa học ngắn thậm chí có mã R ví dụ rất hữu ích.
Ngoài ra câu trả lời ngắn này của Tiến sĩ Bolker http://r.789695.n4.nabble.com/lme-vs-lmer-how-do-they-differ-td2534332.html

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.