Tôi đã chỉ định chính xác mô hình của tôi trong lmer?


26

Tôi đã tìm kiếm rất nhiều trang web trợ giúp và vẫn còn bối rối về cách chỉ định các thuật ngữ lồng nhau phức tạp hơn trong một mô hình hỗn hợp. Tôi cũng bối rối như việc sử dụng :/|quy định cụ thể tương tác và làm tổ với các yếu tố ngẫu nhiên sử dụng lmer()trong các lme4gói trong R.

Với mục đích của câu hỏi này, giả sử tôi đã mô tả chính xác dữ liệu của mình bằng mô hình thống kê tiêu chuẩn này: là cố định và là ngẫu nhiên. là (ngầm) lồng nhau trong .

Ytôijk= =bạn+ga tàutôi+kéoj(tôi)+ngàyk+(ga tàu×ngày)tôik+(kéo×ngày)j(tôi)k
stationtowdayTowstation

Nói cách khác, tôi hy vọng rằng mô hình của tôi bao gồm Trạm (i, đã sửa), Tow (j, ngẫu nhiên, được lồng hoàn toàn trong Trạm), Ngày (k, ngẫu nhiên) và tương tác giữa Tow và Day và tương tác giữa Ngày và Trạm. Tôi đã tham khảo ý kiến ​​của một nhà thống kê để tạo ra mô hình của mình và tại thời điểm này tin rằng nó là đại diện cho dữ liệu của tôi, nhưng cũng sẽ thêm vào một mô tả dữ liệu của tôi cho những người quan tâm ở cuối bài viết của tôi để không bị lộn xộn.

Cho đến nay những gì tôi đã có thể ghép lại với nhau là như sau lmer:

lmer(y ~ station + (1|station:tow) + (1|Day) + (1|station:day) + (1|tow:day), 
     data=my.data)

Điều này mô tả chính xác mô hình thống kê của tôi? Bất kỳ đề xuất nào về cách cải thiện mã của tôi nếu nó không đọc đúng?

Tôi đã nhấn mạnh các thuật ngữ cụ thể mà tôi gặp khó khăn khi chỉ định trong công thức lmer của mình

# 1. kéo được lồng trong trạm khi kéo là ngẫu nhiên và trạm được cố định
Tôi nhầm lẫn, tuy nhiên về sự khác biệt giữa các thuật ngữ tương tác lồng nhau và tương tác ngẫu nhiên sử dụng :/. Trong ví dụ trên của tôi, tôi có (1|station:tow)hy vọng đọc được kéo trong lồng. Tôi đã đọc các bình luận mâu thuẫn trên các trang web khác nhau cho dù tôi nên sử dụng :hay /ở đây theo (1|...)định dạng ngẫu nhiên lmer.

# 2. Sự tương tác giữa trạm và ngày khi trạm cố định và ngày là ngẫu nhiên
tôi có (1|station:day)nhưng lần này tôi hy vọng nó đọc được sự tương tác giữa trạm và ngày. Có vẻ như tôi có thể sử dụng trạm * ngày để tính các tác động riêng lẻ của trạm và ngày cũng như tương tác của chúng (thay vì bao gồm cả ba thuật ngữ riêng biệt như tôi làm ở trên), nhưng tôi không thấy cách chỉ định điều này khi cái này cố định và cái kia là ngẫu nhiên Sẽ station*(1|day)làm điều đó?

# 3. Sự tương tác giữa kéo và ngày (cả ngẫu nhiên) khi kéo được lồng trong trạm (cố định) Sau đó, tôi (1|tow:day)hy vọng sẽ đọc được sự tương tác của towday, nhưng tôi tự hỏi liệu tôi có cần xác định lại kéo đó được lồng không (ngầm) trong trạm?

Tôi chưa quen với cả hai Rlmervà mô hình thống kê và đánh giá rất cao sự rắc rối của việc giải thích kỹ lưỡng trong bất kỳ câu trả lời nào cho câu hỏi của tôi nếu có thể.

Thêm chi tiết về dữ liệu của tôi: Tôi đang hỏi liệu nồng độ sinh vật phù du có khác nhau trên một mặt trận vật lý trong đại dương gần bờ hay không. Tôi có ba trạm, trong nước, trong và ngoài khơi của mặt trận này. Trạm như vậy là cố định. Ở mỗi trạm, tôi lấy ba lần sinh vật phù du sao chép (từ đó tôi sắp xếp, đếm và lấy một nồng độ về số lượng bọ trên mỗi mét khối nước). Tow là ngẫu nhiên: trong ba lần, tôi hy vọng sẽ tính đến sự biến đổi chung của sinh vật phù du tại trạm cụ thể đó. Tow thực chất được lồng trong trạm vì mỗi kéo không có một ID duy nhất (123,123,123 là ID cho các đuôi ở mỗi trạm). Sau đó tôi đã làm điều này trong nhiều ngày, độc lập với một mặt trận mới đã hình thành. Tôi nghĩ rằng tôi có thể nghĩ ngày là một yếu tố chặn? Ngày là ngẫu nhiên vì việc lặp lại điều này vào nhiều ngày trước độc lập đang cố gắng nắm bắt sự biến đổi từ ngày này sang ngày khác và là đại diện của tất cả các ngày mà mặt trận này có mặt. Tôi muốn biết về các điều khoản tương tác để xem liệu Tows thay đổi về độ biến đổi từ ngày này sang ngày khác và liệu các trạm luôn mang lại dữ liệu tương tự hay nó phụ thuộc vào ngày?

Một lần nữa, cảm ơn bạn đã dành thời gian và giúp đỡ, tôi đánh giá cao nó!


Tôi tin rằng bạn đang thiếu một số đăng ký (tôi không muốn thêm chúng vào nếu tôi nhầm) trên mô hình thống kê tiêu chuẩn của bạn.

1
FWIW, đối với bất kỳ ai bắt gặp chủ đề này và tự hỏi liệu nó có thuộc chủ đề hay không, tập trung vào Rcú pháp, IMO, nó đủ thống kê (hiểu cách mô hình được chỉ định liên quan đến lồng và tương tác, v.v.) cho CV.
gung - Phục hồi Monica

1
Đây là 100% về chủ đề theo ý kiến ​​của tôi.


2
Theo bạn lmer()cú pháp, bạn đã chỉ định một mô hình, nơi có một tác dụng cố định stationvà bốn chặn ngẫu nhiên, chia sẻ bởi các cá nhân với nhau (1) kết hợp stationtow, (2) giá trị Day, (3) kết hợp stationdayvà ( 4) kết hợp towday, tương ứng. Đây có phải là những gì bạn dự định? Tôi không chắc chắn bởi vì, như được chỉ định bởi @BabekP, cách bạn viết công thức mô hình của bạn không rõ ràng. Bạn đã viết tên biến, không phải tham số. Thông thường, trong một mô hình như thế này, các kết hợp biến được ghi lại bởi các chỉ số.
Macro

Câu trả lời:


23

Kéo lồng trong trạm khi kéo là ngẫu nhiên và trạm cố định

station+(1|station:tow)đúng. Như @John đã nói trong câu trả lời của mình, (1|station/tow)sẽ mở rộng thành (1|station)+(1|station:tow)(tác dụng chính của trạm cộng với tương tác giữa kéo và trạm), điều mà bạn không muốn vì bạn đã chỉ định trạm là hiệu ứng cố định.

Tương tác giữa trạm và ngày khi trạm cố định và ngày là ngẫu nhiên.

Sự tương tác giữa một hiệu ứng cố định và ngẫu nhiên luôn luôn là ngẫu nhiên. Một lần nữa như @John đã nói, station*daymở rộng tới station+day+station:day, điều mà bạn (một lần nữa) không muốn vì bạn đã chỉ định daytrong mô hình của mình. Tôi không nghĩ có một cách để làm những gì bạn muốn và thu gọn các hiệu ứng chéo của day(ngẫu nhiên) và station(cố định), nhưng bạn có thể nếu bạn muốn viết station+(1|day/station), như được chỉ định trong câu trả lời trước sẽ mở rộng sangstation + (1|day) + (1|day:station) .

tương tác giữa kéo và ngày khi kéo được lồng trong trạm

Bởi vì bạn không có giá trị duy nhất của towbiến (tức là bởi vì như bạn nói dưới đây TOW được quy định như 1, 2, 3tại mỗi trạm, bạn làm cần phải xác định làm tổ, như (1|station:tow:day). Nếu bạn đã có TOW định duy nhất, bạn có thể sử dụng một trong hai (1|tow:day)hoặc (1|station:tow:day)(họ sẽ đưa ra câu trả lời tương đương). Nếu bạn không chỉ định lồng trong trường hợp này, lme4sẽ cố gắng ước tính hiệu ứng ngẫu nhiên được chia sẻ bởi kéo số 1 tại tất cả các trạm ...

station:tow:day×× kết hợp ngày: nếu bạn quên lồng với trạm, bạn sẽ thấy rằng bạn nhận được ít quan sát hơn bạn nghĩ.

http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#model-specificationhttp://bbolker.github.io/mixedmodels-misc/glmmFAQ.html#nested-or-crossed hữu ích đối với bạn?


cảm ơn bạn rất nhiều vì đã trả lời và tham khảo hữu ích, họ được đánh giá cao. Tôi bối rối về ký hiệu (1 | a: b) như bạn mô tả ở trên, trong đó có vẻ như ':' có thể có nghĩa là "lồng vào" cũng như tương tác. Làm thế nào nó có thể chỉ định cả hai? Nói cách khác, làm thế nào để lmer biết mối quan hệ bạn đang chỉ ra? Tôi phải thiếu một cái gì đó cơ bản ở đây, tôi xin lỗi.
wtree

4
Không có nhiều sự khác biệt, trong bối cảnh này, giữa tương tác và lồng nhau. Việc Bcó được lồng trong Ahay chỉ tương tác với nó hay không phụ thuộc vào tác dụng chính của Anó có được đưa vào mô hình hay không. Nếu tác dụng chính của Bcũng trong mô hình sau đó nó vượt qua ...
Bến Bolker

Xin chào tất cả, tôi đã hỏi một câu hỏi liên quan ở đây: stats.stackexchange.com/questions/272377/ Khăn nếu bất cứ ai (đặc biệt là @BenBolker) có cơ hội xem và đưa ra câu trả lời.
Joshua Rosenberg

11

Một số điều trong công thức là một chút bối rối. Phần :dành cho tương tác giữa hai thuật ngữ trong khi phần *dành cho các hiệu ứng và tương tác chính. Đây /là một số khác cho các tương tác nhưng những gì nó làm là tạo ra sự tương tác giữa tử số và tất cả các thuật ngữ trong mẫu số (ví dụ A/(B+C) = A:B + A:C). Đây |là một cái gì đó như "được nhóm bởi". Vì vậy, 1|stationsẽ bị chặn được nhóm theo trạm và trong ngoặc đơn là ngẫu nhiên(1|station) . Đó là cách bạn sẽ làm tổ.

Hy vọng rằng đó là giúp đỡ. Thật kỳ quặc khi có một hiệu ứng ngẫu nhiên được lồng trong một hiệu ứng cố định và tôi không chắc bạn sẽ đại diện cho điều đó như thế nào. Tôi thậm chí không thể tưởng tượng được tình hình. Bạn có thể nhận được phản hồi tốt hơn nếu bạn chỉ giải thích các biến của bạn là gì và bạn muốn đạt được điều gì. Rất nhiều lần mọi người đặt câu hỏi và sử dụng thuật ngữ sai và thật khó để giao tiếp. Giải thích những gì các biến đại diện và những gì bạn muốn biết về chúng.

Tập trung vào mô tả của bạn trong đoạn cuối của bạn, có vẻ như kéo của bạn chỉ đơn giản là một chỉ báo về các mẫu bạn đã thu thập và không phải là thứ bạn cần ước tính theo nghĩa mà bạn mong đợi kéo 1 sẽ khác biệt so với kéo 2 theo một cách nào đó. Tow chỉ là một mẫu. Trừ khi bạn thực sự tin rằng thứ tự của các vấn đề quan trọng, bạn thậm chí không bận tâm đến biến đó. Và nếu chúng quan trọng thì đó là một hiệu ứng cố định (và có thể là ngẫu nhiên, nhưng không phải là hiệu ứng ngẫu nhiên duy nhất). Bạn nói rằng bạn muốn biết nếu đuôi thay đổi trong sự thay đổi từ ngày này sang ngày khác. Làm thế nào về câu trả lời là có? Đó không phải là lĩnh vực của xác suất thực tế mà họ không thay đổi theo từng ngày. Đó chỉ là phương sai của các biện pháp của bạn. Bạn' không được phép cố gắng tính toán cho mọi thông số phương sai bởi vì sau đó bạn sẽ không có bất kỳ phương sai nào còn sót lại. Bạn sẽ có một mô hình được chỉ định quá mức. Bạn sẽ ở điểm chỉ báo cáo từng biện pháp.

Bạn đưa ra một tuyên bố tương tự về việc tự hỏi nếu trạm thay đổi theo ngày; tất nhiên nó. Nhưng có lẽ bạn có nghĩa là ngày cụ thể? Là những ngày được nhóm theo một cách nào đó theo mùa, chu kỳ mặt trăng, vv? Trừ khi bạn có một cái gì đó khác ngoài chỉ là ngày 1, đây là ngày 2, v.v ... làm sao biết rằng các trạm khác nhau hàng ngày cho bạn biết bất cứ điều gì khác ngoài các trạm khác nhau? Vì vậy, câu trả lời cho câu hỏi đó là, tất nhiên các trạm thay đổi theo từng ngày. Và tất nhiên, đuôi thay đổi từng ngày và từng trạm. Bạn kết thúc bên trái với một mô hình đơn giản:

aov(y ~ station, data = dat)

Một hiệu ứng cố định bạn có ở đây, trạm, chỉ được lấy mẫu qua nhiều lần và nhiều ngày. Tôi không chắc chắn bạn thực sự cần mô hình đa cấp ở đây. Có vẻ như bạn đang quá chỉ định mô hình của bạn.

Nếu bạn thực sự muốn có hiệu ứng kéo và ngày ngẫu nhiên và có thông tin mà bạn chưa chỉ định ở đây thì bạn có thể mở rộng nó ra thành một mô hình đa cấp. Đó sẽ là:

lmer(y ~ station + (two*day|station), data = dat)

Bạn cần nhiều tows tại mỗi trạm và ngày để sử dụng mô hình đó.


Tôi đồng ý với tất cả những gì bạn đã nói nhưng tôi nghĩ rằng đây có lẽ là một nhận xét nhiều hơn là một câu trả lời.
Macro

@ John Tôi đã ở bên bạn cho đến khi "đó là cách bạn sẽ làm tổ". Tôi nghĩ rằng tôi đã bỏ lỡ điểm thực tế về cách bạn làm tổ. Bạn có sẵn lòng giải thích chi tiết hơn không? Tôi nghĩ rằng tôi vẫn còn bối rối bởi | và sẽ nhìn vào nó nhiều hơn Nhưng từ phản hồi của bạn, tôi vẫn không chắc chắn làm thế nào để chỉ ra rằng kéo (ngẫu nhiên) được lồng trong trạm (cố định)?
wtree

@ John và trạm được cố định là các trang web / địa điểm quan tâm trong đại dương và kéo là ngẫu nhiên vì tôi đang sử dụng các sinh vật phù du tại các địa điểm này một cách ngẫu nhiên ở chỗ chúng đang cố gắng tính toán sự thay đổi của sinh vật phù du ở mỗi địa điểm và sau đó được ngoại suy để đại diện cho quần thể sinh vật phù du tại một trạm.
wtree

1
Không phải mọi nhãn của mẫu là một biến ngẫu nhiên, xem các chỉnh sửa.
Giăng

1
Tôi vẫn nghĩ rằng kéo không nên có trong mô hình ở tất cả các mô tả đó. Ngày nghe có vẻ tốt.
Giăng
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.