nhận được mức độ tự do từ lmer


11

Tôi đã phù hợp với một mô hình lmer với những điều sau đây (mặc dù đầu ra được tạo thành):

Random effects:
 Groups        Name        Std.Dev.
 day:sample (Intercept)    0.09
 sample        (Intercept) 0.42
 Residual                  0.023 

Tôi thực sự muốn xây dựng khoảng tin cậy cho từng hiệu ứng bằng công thức sau:

(n1)s2χα/2,n12,(n1)s2χ1α/2,n12

Có cách nào để thuận tiện để có được mức độ tự do?


1
Tôi nghĩ rằng bạn muốn kiểm tra lmerTest . Có một số phép tính gần đúng để ước tính df trong mô hình hiệu ứng hỗn hợp cho các hiệu ứng cố định (ví dụ: Satterthwaite , Kenward-Roger, v.v.) Bạn giả sử mỗi hiệu ứng là Gaussian. Chỉ cần sử dụng độ lệch chuẩn để có được khoảng tin cậy của sự lựa chọn của bạn.
usεr11852

3
@ usεr11852 Trong mô hình hiệu ứng hỗn hợp, bạn giả sử rằng mỗi hiệu ứng là Gaussian, nhưng tham số là phương sai của phân phối Gaussian, không phải là giá trị trung bình. Vì vậy, việc phân phối công cụ ước tính của nó sẽ rất sai lệch và khoảng tin cậy độ lệch chuẩn ± ~ 2 bình thường sẽ không phù hợp.
Karl Ove Hufthammer

1
@KarlOveHufthammer: Bạn có quyền chỉ ra điều này; Tôi hiểu ý của bạn (và có lẽ là OP). Tôi nghĩ rằng anh ta quan tâm đến các phương tiện và / hoặc việc thực hiện các hiệu ứng ngẫu nhiên khi anh ta đề cập đến mức độ tự do.
usεr11852

mức độ tự do là "có vấn đề" đối với các mô hình hỗn hợp, xem: stat.ethz.ch/pipermail/r-help/2006-May/094765.htmlstats.stackexchange.com/questions/84268/iêu
Tim

Câu trả lời:


17

Thay vào đó tôi sẽ chỉ tạo khoảng tin cậy khả năng hồ sơ . Chúng đáng tin cậy và rất dễ tính toán khi sử dụng gói 'lme4'. Thí dụ:

> library(lme4)
> fm = lmer(Reaction ~ Days + (Days | Subject),
            data=sleepstudy)
> summary(fm)
[]
Random effects:
 Groups   Name        Variance Std.Dev. Corr
 Subject  (Intercept) 612.09   24.740       
          Days         35.07    5.922   0.07
 Residual             654.94   25.592       

Bây giờ bạn có thể tính khoảng tin cậy khả năng của hồ sơ với confint()hàm:

> confint(fm, oldNames=FALSE)
Computing profile confidence intervals ...
                               2.5 %  97.5 %
sd_(Intercept)|Subject        14.381  37.716
cor_Days.(Intercept)|Subject  -0.482   0.685
sd_Days|Subject                3.801   8.753
sigma                         22.898  28.858
(Intercept)                  237.681 265.130
Days                           7.359  13.576

Bạn cũng có thể sử dụng bootstrap tham số để tính khoảng tin cậy. Đây là cú pháp R (sử dụng parmđối số để hạn chế tham số nào chúng ta muốn khoảng tin cậy):

> confint(fm, method="boot", nsim=1000, parm=1:3)
Computing bootstrap confidence intervals ...
                              2.5 % 97.5 %
sd_(Intercept)|Subject       11.886 35.390
cor_Days.(Intercept)|Subject -0.504  0.929
sd_Days|Subject               3.347  8.283

Các kết quả sẽ tự nhiên thay đổi phần nào cho mỗi lần chạy. Bạn có thể tăng nsimđể giảm biến thể này, nhưng điều này cũng sẽ tăng thời gian cần thiết để ước tính khoảng tin cậy.


1
Câu trả lời hay (+1). Tôi cũng sẽ đề cập đến thực tế là người ta cũng có thể nhận được các TCTD từ bootstrap tham số trong trường hợp này. Đây chủ đề chứa một cuộc thảo luận rất thú vị về vấn đề này.
usεr11852

@ usεr11852 Cảm ơn bạn đã gợi ý. Bây giờ tôi đã thêm một ví dụ bằng cách sử dụng bootstrap tham số.
Karl Ove Hufthammer

6

Độ tự do cho các mô hình hỗn hợp là "có vấn đề". Để đọc thêm về nó, bạn có thể kiểm tra độ sáng, giá trị p và tất cả những gì được đăng bởi Douglas Bates. Ngoài ra r-sig-hỗn hợp mô hình Câu hỏi thường gặp tóm tắt lý do tại sao nó gây phiền nhiễu:

  • Nói chung, không rõ ràng rằng phân phối null của tỷ lệ tính toán của tổng bình phương thực sự là phân phối F, cho bất kỳ sự lựa chọn nào về mức độ tự do của mẫu số. Mặc dù điều này đúng với các trường hợp đặc biệt tương ứng với các thiết kế thử nghiệm cổ điển (lồng nhau, tách lô, khối ngẫu nhiên, v.v.), nhưng rõ ràng không đúng với các thiết kế phức tạp hơn (không cân bằng, GLMM, tương quan thời gian hoặc không gian, v.v.).
  • Đối với mỗi công thức mức độ tự do đơn giản đã được đề xuất (dấu vết của ma trận mũ, v.v.) dường như có ít nhất một ví dụ khá đơn giản trong đó công thức thất bại nặng nề.
  • Các lược đồ gần đúng df khác đã được đề xuất (Satterthwaite, Kenward-Roger, v.v.) dường như khá khó thực hiện trong lme4 / nlme,
    (...)
  • Bởi vì các tác giả chính của lme4 không bị thuyết phục về tiện ích của phương pháp thử nghiệm chung có liên quan đến phân phối null gần đúng và do chi phí của bất kỳ ai khác đào sâu vào mã để kích hoạt chức năng có liên quan (dưới dạng bản vá hoặc thêm -on), tình huống này khó có thể thay đổi trong tương lai.

Câu hỏi thường gặp cũng cung cấp một số lựa chọn thay thế

  • sử dụng MASS :: glmmPQL (sử dụng các quy tắc nlme cũ tương đương với quy tắc 'bên trong bên ngoài' của SAS) cho GLMM hoặc (n) lme cho LMM
  • Đoán mẫu số df từ các quy tắc chuẩn (đối với thiết kế tiêu chuẩn) và áp dụng chúng cho các thử nghiệm t hoặc F
  • Chạy mô hình trong lme (nếu có thể) và sử dụng mẫu số df được báo cáo ở đó (tuân theo quy tắc 'bên trong-bên ngoài' đơn giản, tương ứng với câu trả lời chính tắc cho các thiết kế đơn giản / trực giao), áp dụng cho các thử nghiệm t hoặc F. Để biết thông số kỹ thuật rõ ràng về các quy tắc mà tôi sử dụng, hãy xem trang 91 của Pinheiro và Bates - trang này có sẵn trên Google Sách
  • sử dụng SAS, Genstat (AS-REML), Stata?
  • Giả sử mẫu số vô hạn df (nghĩa là kiểm tra bình phương Z / chi chứ không phải t / F) nếu số lượng nhóm lớn (> 45? Các quy tắc ngón tay cái khác nhau cho "lớn vô hạn" đã được đặt ra, bao gồm [trong Angrist và Pischke '' Kinh tế lượng vô hại ''], 42 (để tỏ lòng kính trọng với Douglas Adams)

Nhưng nếu bạn quan tâm đến khoảng tin cậy, có những cách tiếp cận tốt hơn, ví dụ dựa trên bootstrap như đề xuất của Karl Ove Hufthammer trong câu trả lời của anh ấy, hoặc những cách được đề xuất trong FAQ.


"Đoán mẫu số df từ các quy tắc tiêu chuẩn (đối với thiết kế tiêu chuẩn) và áp dụng chúng cho các thử nghiệm t hoặc F"; Tôi thực sự muốn nếu ai đó có thể giải thích về điều đó. Ví dụ, đối với thiết kế lồng nhau (ví dụ: bệnh nhân so với điều khiển, một số mẫu cho mỗi đối tượng; với ID chủ đề là hiệu ứng ngẫu nhiên), làm thế nào để chúng ta có được mức độ tự do cho thiết kế như vậy?
Arnaud A
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.