Làm thế nào để thực hiện một mô hình hỗn hợp bằng cách sử dụng hàm betareg trong R?


12

Tôi có một bộ dữ liệu bao gồm các tỷ lệ đo "mức độ hoạt động" của nòng nọc riêng lẻ, do đó làm cho các giá trị bị ràng buộc trong khoảng từ 0 đến 1. Dữ liệu này được thu thập bằng cách đếm số lần cá nhân di chuyển trong một khoảng thời gian nhất định (1 cho chuyển động, 0 không có chuyển động), và sau đó lấy trung bình để tạo một giá trị cho mỗi cá nhân. Hiệu ứng cố định chính của tôi sẽ là "mức mật độ".

Vấn đề tôi gặp phải là tôi có một biến nhân tố, "ao" mà tôi muốn đưa vào như một hiệu ứng ngẫu nhiên - tôi không quan tâm đến sự khác biệt giữa các ao, nhưng muốn tính đến chúng theo thống kê. Một điểm quan trọng về các ao là tôi chỉ có 3 trong số chúng và tôi hiểu rằng thật lý tưởng khi có nhiều cấp độ yếu tố (5+) khi xử lý các hiệu ứng ngẫu nhiên.

Nếu có thể làm được, tôi muốn có một lời khuyên về cách triển khai mô hình hỗn hợp bằng cách sử dụng betareg()hoặc betamix()trong R. Tôi đã đọc các tệp trợ giúp R, nhưng tôi thường thấy chúng khó hiểu (ý nghĩa của từng tham số đối số trong ngữ cảnh dữ liệu của riêng tôi VÀ ý nghĩa của các giá trị đầu ra trong các thuật ngữ sinh thái) và vì vậy tôi có xu hướng làm việc tốt hơn thông qua các ví dụ.

Trên một lưu ý liên quan, tôi đã tự hỏi liệu thay vào đó tôi có thể sử dụng một glm()nhóm nhị phân và liên kết logit, để thực hiện kế toán cho các hiệu ứng ngẫu nhiên với loại dữ liệu này.


không, bạn không thể khắc phục các điều khoản lỗi trong glm (). Điều gì về logit biến đổi phản ứng của bạn và xem xét một mô hình hỗn hợp tuyến tính?
utobi

@utobi Cảm ơn bạn, tôi sẽ thử cái này. Vì vậy, bạn không có mối quan tâm có hiệu ứng ngẫu nhiên chỉ với 3 cấp độ?
Kat Y

Tôi không biết ý nghĩa của "ao" biến của bạn, nhưng nếu bạn có các biện pháp lặp đi lặp lại, các hiệu ứng ngẫu nhiên gần như là điều bắt buộc. Trong trường hợp bạn không có các biện pháp lặp lại, ở đây ngẫu nhiên và cố định là một cuộc tranh luận mở. Ba mức hiệu ứng ngẫu nhiên có thể ổn, về nguyên tắc phương sai của chúng là có thể ước tính được. Tôi đề nghị bạn kiểm tra tài liệu trong lĩnh vực của bạn. Một cuốn sách hay thảo luận về các hiệu ứng ngẫu nhiên và cố định là stat.columbia.edu/~gelman/arm .
utobi

1
@utobi cảm ơn lời khuyên của bạn. Nó rất hữu ích. Tôi sẽ xem cuốn sách đó! Tôi đã kết thúc việc chuyển đổi logit và sử dụng lmer ().
Kat Y

Câu trả lời:


11

Các khả năng hiện tại betaregkhông bao gồm các hiệu ứng ngẫu nhiên / hỗn hợp. Trong betareg()bạn chỉ có thể bao gồm hiệu ứng cố định, ví dụ, cho biến ao ba cấp của bạn. Các betamix()chức năng cụ một hữu hạn hỗn hợp beta hồi quy, không phải là một hỗn hợp hồi quy ảnh hưởng beta.

Trong trường hợp của bạn, trước tiên tôi sẽ thử xem ảnh hưởng của hiệu ứng yếu tố ao cố định. Điều này "tiêu tốn" cho bạn hai bậc tự do trong khi hiệu ứng ngẫu nhiên sẽ rẻ hơn một chút chỉ với một mức độ tự do bổ sung. Nhưng tôi sẽ ngạc nhiên nếu hai cách tiếp cận dẫn đến những hiểu biết rất khác nhau về chất lượng.

Cuối cùng, mặc glm()dù không hỗ trợ hồi quy beta, nhưng trong mgcvgói có betar()họ có thể được sử dụng với gam()hàm.


Cảm ơn về thông tin bạn vừa nhập. Bạn đã làm rõ một số khía cạnh của các chức năng betareg. Tại thời điểm này, tôi đã thực hiện lời khuyên của @utobi và đã thực hiện các phép biến đổi logit để tôi có thể sử dụng lmer (). Tôi sẽ xem xét gam () vì tập dữ liệu tiếp theo của tôi cũng bị ràng buộc giữa 0 và 1 và tôi không thể bình thường hóa các bản phân phối thông qua các phép biến đổi :)
Kat Y

1
Tôi hy vọng rằng các phương pháp tiếp cận trả về kết quả tương tự nhưng cũng có một số khác biệt từ đó bạn có thể học được điều gì đó. Vì vậy, tôi khuyên bạn nên thử cả ba, nghĩa là betaregvới các hiệu ứng cố định, chuyển đổi logit lmervới các hiệu ứng ngẫu nhiên và gamvới betar. (Và cũng: Nếu câu trả lời là hữu ích, hãy xem xét nâng cấp hoặc chấp nhận nó.)
Achim Zeileis

15

Gói glmmTMB có thể hữu ích cho bất kỳ ai có câu hỏi tương tự. Ví dụ: nếu bạn muốn bao gồm ao từ câu hỏi trên dưới dạng hiệu ứng ngẫu nhiên, đoạn mã sau sẽ thực hiện mẹo:

glmmTMB(y ~ 1 + (1|pond), df, family=list(family="beta",link="logit"))

Chào mừng đến với CV. Cảm ơn sự đóng góp của bạn. Đây là một nhận xét hơn là một câu trả lời. Bạn có thể mở rộng câu trả lời của bạn xin vui lòng?
Ferdi

Xin lỗi vì sự chậm trễ, tôi đã không thấy bình luận ngay lập tức. Mong rằng sẽ giúp.
Kori K

3

Điều này bắt đầu như một bình luận, nhưng đã đi lâu. Tôi không nghĩ rằng một mô hình hiệu ứng ngẫu nhiên là phù hợp ở đây. Chỉ có 3 ao - bạn có muốn ước tính phương sai từ 3 số không? Đó là những gì đang xảy ra với một mô hình hiệu ứng ngẫu nhiên. Tôi đoán rằng các ao được chọn vì lý do thuận tiện cho nhà nghiên cứu, và không phải là một mẫu ngẫu nhiên của "Ao của châu Mỹ".

Ưu điểm của mô hình hiệu ứng ngẫu nhiên là nó cho phép bạn xây dựng khoảng tin cậy trên mức độ đáp ứng (mức độ hoạt động) đưa ao vào biến thể ao vào tài khoản. Một mô hình hiệu ứng cố định - nói cách khác, coi ao như một khối - điều chỉnh phản ứng cho hiệu ứng ao. Nếu có một số hiệu ứng điều trị nghiện - nói rằng hai loài ếch trong mỗi ao - chặn sẽ làm giảm sai số bình phương trung bình (mẫu số của xét nghiệm F) và cho phép hiệu quả của việc điều trị tỏa sáng.

Trong ví dụ này, không có hiệu quả xử lý và số lượng ao quá nhỏ đối với mô hình hiệu ứng ngẫu nhiên (và có lẽ quá "không ngẫu nhiên"), vì vậy tôi không chắc kết luận nào có thể được rút ra từ nghiên cứu này. Người ta có thể có được một ước tính tốt đẹp về sự khác biệt giữa các ao, nhưng đó là về nó. Tôi không thấy những suy luận được thu hút vào quần thể ếch rộng lớn hơn trong các môi trường ao khác. Người ta có thể đóng khung nó như một nghiên cứu thí điểm, tôi cho rằng.

Hãy nhớ rằng bất kỳ việc sử dụng mô hình hiệu ứng ngẫu nhiên nào ở đây sẽ đưa ra một ước tính rất không đáng tin cậy cho phương sai ao và phải được sử dụng thận trọng.

Nhưng như câu hỏi ban đầu của bạn - đây không phải là vấn đề về tỷ lệ sao? Phân phối đi tới cho các sự kiện trên mỗi đơn vị thời gian là Poisson. Vì vậy, bạn có thể thực hiện hồi quy Poisson bằng cách sử dụng số đếm với khoảng thời gian làm phần bù.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.