Mô hình hiệu ứng hỗn hợp với Nesting


34

Tôi có dữ liệu được thu thập từ một thử nghiệm được tổ chức như sau:

Hai trang web, mỗi trang web có 30 cây. 15 được điều trị, 15 được kiểm soát tại mỗi trang web. Từ mỗi cây, chúng tôi lấy mẫu ba mảnh thân và ba mảnh rễ, vì vậy 6 mẫu cấp 1 cho mỗi cây được đại diện bởi một trong hai cấp độ yếu tố (gốc, thân). Sau đó, từ các mẫu thân / rễ đó, chúng tôi lấy hai mẫu bằng cách phân tích các mô khác nhau trong mẫu, được biểu thị bằng một trong hai mức yếu tố cho loại mô (loại mô A, loại mô B). Các mẫu này được đo như một biến liên tục. Tổng số quan sát là 720; 2 vị trí * 30 cây * (ba mẫu thân + ba mẫu gốc) * (một mẫu A mẫu + một mẫu B mô). Dữ liệu trông như thế này ...

        ï..Site Tree Treatment Organ Sample Tissue Total_Length
    1        L  LT1         T     R      1 Phloem           30
    2        L  LT1         T     R      1  Xylem           28
    3        L  LT1         T     R      2 Phloem           46
    4        L  LT1         T     R      2  Xylem           38
    5        L  LT1         T     R      3 Phloem          103
    6        L  LT1         T     R      3  Xylem           53
    7        L  LT1         T     S      1 Phloem           29
    8        L  LT1         T     S      1  Xylem           21
    9        L  LT1         T     S      2 Phloem           56
    10       L  LT1         T     S      2  Xylem           49
    11       L  LT1         T     S      3 Phloem           41
    12       L  LT1         T     S      3  Xylem           30

Tôi đang cố gắng để phù hợp với một mô hình hiệu ứng hỗn hợp sử dụng R và lme4, nhưng mới đối với các mô hình hỗn hợp. Tôi muốn mô hình hóa phản ứng như Yếu tố điều trị + Cấp độ 1 (thân, rễ) + Yếu tố cấp 2 (mô A, mô B), với các hiệu ứng ngẫu nhiên cho các mẫu cụ thể được lồng trong hai cấp độ.

Trong R, tôi đang làm điều này bằng cách sử dụng lmer, như sau

fit <- lmer(Response ~ Treatment + Organ + Tissue + (1|Tree/Organ/Sample)) 

Từ sự hiểu biết của tôi (... không chắc chắn, và tại sao tôi đăng bài!) Thuật ngữ:

(1|Tree/Organ/Sample)

Chỉ định rằng 'Mẫu' được lồng trong các mẫu nội tạng, được lồng trong cây. Là loại lồng này có liên quan / hợp lệ? Xin lỗi nếu câu hỏi này không rõ ràng, nếu vậy, vui lòng ghi rõ nơi tôi có thể giải thích.

Câu trả lời:


33

Tôi nghĩ rằng điều này là đúng.

  • (1|Tree/Organ/Sample)mở rộng thành / tương đương với (1|Tree)+(1|Tree:Organ)+(1|Tree:Organ:Sample)(trong đó :biểu thị một tương tác).
  • Các yếu tố cố định Treatment, OrganTissuetự động được xử lý ở mức chính xác.
  • Bạn có thể nên đưa Sitevào như một hiệu ứng cố định (về mặt khái niệm đó là một hiệu ứng ngẫu nhiên, nhưng sẽ không thực tế khi cố gắng ước tính phương sai giữa các trang chỉ có hai trang); điều này sẽ làm giảm phương sai giữa các cây một chút.
  • Bạn có thể nên bao gồm tất cả dữ liệu trong một khung dữ liệu và chuyển thông tin này rõ ràng lmerthông qua một data=my.data.frameđối số.

Bạn có thể thấy Câu hỏi thường gặp về glmm hữu ích (nó tập trung vào GLMM nhưng cũng có nội dung phù hợp với mô hình hỗn hợp tuyến tính).


Điều gì xảy ra nếu Erik muốn chỉ định cấu trúc hiệp phương sai cho các lần chặn này? Tức là người ta có thể mong đợi một mẫu có cây chặn dương tính cũng có khả năng chặn Organ dương. Liệu lồng có tự động giải quyết vấn đề này? Nếu không, làm thế nào người ta có thể chỉ định một cấu trúc như vậy?
Sheridan Grant

Tôi nghĩ rằng nếu bạn cố gắng viết ra các phương trình cho trường hợp đó, bạn sẽ thấy rằng nó được quan tâm.
Ben Bolker

13

Tôi đã đọc câu hỏi này và câu trả lời của Tiến sĩ Bolker, và cố gắng sao chép dữ liệu (không quan tâm nhiều, thẳng thắn, về "độ dài" đại diện cho các thuật ngữ hoặc đơn vị sinh học, và sau đó phù hợp với mô hình như trên. để chia sẻ và tìm kiếm thông tin phản hồi về sự hiện diện có thể xảy ra của những hiểu lầm.

Mã tôi đã sử dụng để tạo dữ liệu hư cấu này có thể được tìm thấy ở đây và bộ dữ liệu có cấu trúc bên trong của OP:

     site     tree treatment organ sample tissue    length
1    L       LT01         T  root      1  phloem  108.21230
2    L       LT01         T  root      1  xylem   138.54267
3    L       LT01         T  root      2  phloem   68.88804
4    L       LT01         T  root      2  xylem   107.91239
5    L       LT01         T  root      3  phloem   96.78523
6    L       LT01         T  root      3  xylem    88.93194
7    L       LT01         T  stem      1  phloem  101.84103
8    L       LT01         T  stem      1  xylem   118.30319

Cấu trúc như sau:

 'data.frame':  360 obs. of  7 variables:
     $ site     : Factor w/ 2 levels "L","R": 1 1 1 1 1 1 1 1 1 1 ...
 $ tree     : Factor w/ 30 levels "LT01","LT02",..: 1 1 1 1 1 1 1 1 1 1 ...
     $ treatment: Factor w/ 2 levels "C","T": 2 2 2 2 2 2 2 2 2 2 ...
 $ organ    : Factor w/ 2 levels "root","stem": 1 1 1 1 1 1 2 2 2 2 ...
     $ sample   : num  1 1 2 2 3 3 1 1 2 2 ...
 $ tissue   : Factor w/ 2 levels "phloem","xylem": 1 2 1 2 1 2 1 2 1 2 ...
     $ length   : num  108.2 138.5 68.9 107.9 96.8 ...

Tập dữ liệu đã được "gian lận" (phản hồi ở đây sẽ được hoan nghênh) như sau:

  1. Đối với treatment, có một hiệu ứng cố định với hai lần chặn khác nhau để điều trị so với kiểm soát ( 100so với 70) và không có tác dụng ngẫu nhiên.
  2. Tôi đặt các giá trị cho tissuecác hiệu ứng cố định nổi bật với các mức chặn rất khác nhau cho phloemso với xylem( 3so với 6) và các hiệu ứng ngẫu nhiên với a sd = 3.
  3. organcó hai chặn ngẫu nhiên "đóng góp" từ (ví dụ ) với sự đóng góp hiệu ứng cố định để đánh chặn của cho cả hai và .N(0,3)sd = 36rootstem
  4. Đối với treechúng tôi chỉ có hiệu ứng ngẫu nhiên với a sd = 7.
  5. Đối với sampletôi đã cố gắng chỉ thiết lập hiệu ứng ngẫu nhiên với sd = 5.
  6. Đối với sitecũng chỉ là ngẫu nhiên eff với sd = 3.

Không có độ dốc được thiết lập, do tính chất phân loại của các biến.

Kết quả của mô hình hiệu ứng hỗn hợp:

fit <- lmer(length ~ treatment + organ + tissue + (1|tree/organ/sample), data = trees) 

là:

 Random effects:
 Groups              Name        Variance  Std.Dev. 
 sample:(organ:tree) (Intercept) 9.534e-14 3.088e-07
 organ:tree          (Intercept) 0.000e+00 0.000e+00
 tree                (Intercept) 4.939e+01 7.027e+00
 Residual                        3.603e+02 1.898e+01
Number of obs: 360, groups:  sample:(organ:tree), 180; organ:tree, 60; tree, 30

Fixed effects:
            Estimate Std. Error       df t value Pr(>|t|)    
(Intercept)  79.8623     2.7011  52.5000  29.567  < 2e-16 ***
treatmentT   21.4368     3.2539  28.0000   6.588 3.82e-07 ***
organstem     0.1856     2.0008 328.0000   0.093    0.926    
tissuexylem   3.1820     2.0008 328.0000   1.590    0.113    
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Làm thế nào nó hoạt động ra:

  1. Đối với treatmentviệc đánh chặn mà không cần điều trị là 79.8623(tôi thiết lập một phương tiện 70) và với điều trị đó là 79.8623 + 21.4368 = 101.2991(chúng tôi thiết lập một phương tiện 100.
  2. Đối với tissueđã có một 3.1820đóng góp cho sự đánh chặn biếu không của xylem, và tôi đã thiết lập một sự khác biệt giữa phloemxylemcủa 3. Các hiệu ứng ngẫu nhiên không phải là một phần của mô hình.
  3. Đối với organ, các mẫu từ việc stemđánh chặn tăng lên 0.1856- Tôi đã thiết lập không có sự khác biệt về hiệu ứng cố định giữa stemroot. Độ lệch chuẩn của những gì tôi muốn đóng vai trò là hiệu ứng ngẫu nhiên không được phản ánh.
  4. Các treehiệu ứng ngẫu nhiên với một sd 7nổi lên độc đáo như 7.027.
  5. Đối với sample, ban đầu sdcủa 5đã được nhấn mạnh như 3.088.
  6. site không phải là một phần của mô hình.

Vì vậy, về tổng thể, có vẻ như mô hình phù hợp với cấu trúc của dữ liệu.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.