Mô hình hiệu ứng hỗn hợp tuyến tính với dữ liệu nghiên cứu sinh đôi


14

Giả sử tôi có một số biến trả lời yij được đo từ anh chị em thứ j trong gia đình i . Ngoài ra, một số dữ liệu hành vi xij được thu thập cùng lúc từ mỗi đối tượng. Tôi đang cố gắng phân tích tình huống với mô hình hiệu ứng hỗn hợp tuyến tính sau:

yij=α0+α1xij+δ1ixij+εij

Trong đó α 1 là độ dốc cố định và độ dốc tương ứng, δ 1 i là độ dốc ngẫu nhiên và ε i j là phần dư.α0α1δ1iεij

Các giả định cho các hiệu ứng ngẫu nhiên và dư ε i j là (giả sử chỉ có hai anh chị em trong mỗi gia đình)δ1iεij

δ1idN(0,τ2)(εi1,εi2)TdN((0,0)T,R)

nơi là một tham số sai không rõ và cấu trúc sai-hiệp phương sai R là 2 x 2 ma trận đối xứng của hình thứcτ2R

(r12r122r122r22)

mô hình tương quan giữa hai anh chị em.

  1. Đây có phải là một mô hình thích hợp cho một nghiên cứu anh chị em như vậy?

  2. Dữ liệu hơi phức tạp một chút. Trong số 50 gia đình, gần 90% trong số họ là anh em sinh đôi bị chóng mặt (DZ). Đối với các gia đình còn lại,

    1. hai người chỉ có một anh chị em;
    2. hai người có một cặp DZ cộng với một anh chị em; và
    3. hai có một cặp DZ cộng với hai anh chị em khác.


    Tôi tin lmevào gói R nlmecó thể dễ dàng xử lý (1) với tình huống thiếu hoặc không cân bằng. Vấn đề của tôi là, làm thế nào để đối phó với (2) và (3)? Một khả năng tôi có thể nghĩ đến là chia bốn gia đình trong (2) và (3) thành hai để mỗi phân họ sẽ có một hoặc hai anh chị em để mô hình trên vẫn có thể được áp dụng. Điều này có tốt không Một lựa chọn khác là chỉ cần vứt bỏ dữ liệu từ một hoặc hai anh chị em trong (2) và (3), điều này dường như là một sự lãng phí. Bất kỳ phương pháp tốt hơn?

  3. Dường như lmecho phép người ta sửa các giá trị trong ma trận phương sai - hiệp phương sai R , ví dụ r 2 12 = 0,5. Liệu nó có ý nghĩa để áp đặt cấu trúc tương quan, hay tôi chỉ nên ước tính nó dựa trên dữ liệu?rRr122


1
Làm những gì biểu thị? xj
Macro

@Macro: Cảm ơn vì đã phát hiện ra điều đó. Chỉ cần sửa đổi OP để chỉ ra rằng là một biến giải thích, thước đo hành vi từ mỗi anh chị em. xij
bluepole

1
Câu hỏi và ứng dụng rất thú vị. Tôi có thể thiếu một cái gì đó nhưng dường như với tôi mô hình này được tham số hóa quá mức. Các lỗi tương quan có thể được xác định thành một thành phần "không chia sẻ" và thành phần "chia sẻ", phần sau có chức năng tương tự như δ 0 i . Bạn sẽ phải xóa δ 0 iϵi1,ϵi2δ0iδ0i , làm cho lỗi iid 's, hoặc áp đặt những hạn chế như r 2 12 = 0,5 cho identifiability - bạn đang làm điều đó vào mục đích để tách các thành phần môi trường / di truyền để anh chị em tương quan?ϵr122=.5
Macro

@Macro: Bạn nói đúng: không cần thiết trong mô hình. Cảm ơn đã chỉ ra điều này! Kỳ lạ là không phàn nàn về sự dư thừa như vậy. δ0ilme
bluepole

Bạn vẫn đang làm việc với mô hình quá tham số này (một phần câu hỏi của bạn chưa được chỉnh sửa)?
Macro

Câu trả lời:


10

Bạn có thể bao gồm các cặp song sinh và không sinh đôi trong một mô hình hợp nhất bằng cách sử dụng một biến giả và bao gồm các độ dốc ngẫu nhiên trong biến giả đó. Vì tất cả các gia đình đều có nhiều nhất một cặp sinh đôi, nên điều này sẽ tương đối đơn giản:

Đặt nếu anh chị em jAij=1j trong gia đình là anh em sinh đôi và 0 nếu không. Tôi giả sử bạn cũng muốn dốc ngẫu nhiên để khác nhau cho các cặp song sinh so với anh chị em thường xuyên - nếu không muốn nói, không bao gồm các η i 3 hạn trong mô hình dưới đây.iηi3

Sau đó, phù hợp với mô hình:

yij=α0+α1xij+ηi0+ηi1Aij+ηi2xij+ηi3xijAij+εij
  • là hiệu ứng cố định, như trong đặc tả của bạnα0,α1

  • là hiệu ứng ngẫu nhiên anh chị em của 'cơ sở' và η i 1 là hiệu ứng ngẫu nhiên bổ sung cho phép cặp song sinh giống nhau hơn so với anh chị em thông thường. Các kích thước của phương sai hiệu ứng ngẫu nhiên tương ứng định lượng mức độ giống nhau của anh chị em và mức độ sinh đôi tương tự nhiều hơn so với anh chị em thông thường. Lưu ý rằng cả hai mối tương quan sinh đôi và không sinh đôi được đặc trưng bởi mô hình này - tương quan sinh đôi được tính bằng cách tính tổng các hiệu ứng ngẫu nhiên một cách thích hợp (cắm vào A i j = 1 ).ηi0ηi1Aij=1

  • η i 3 có vai trò tương tự nhau, chỉ có chúng đóng vai trò là các sườn ngẫu nhiên của x i jηi2ηi3xij

  • là những thuật ngữ lỗi iid - lưu ý rằng tôi đã viết mô hình của bạn hơi khác nhau về chặn ngẫu nhiên chứ không phải là lỗi còn lại tương quan.εij

Bạn có thể phù hợp với mô hình bằng cách sử dụng Rgói lme4. Trong mã bên dưới biến phụ thuộc là y, biến giả là A, yếu tố dự đoán x, là sản phẩm của biến giả và biến dự đoán là AxfamIDlà số định danh cho gia đình. Dữ liệu của bạn được coi là được lưu trữ trong một khung dữ liệu D, với các biến này là các cột.

library(lme4) 
g <- lmer(y ~ x + (1+A+x+Ax|famID), data=D) 

Các biến hiệu ứng ngẫu nhiên và ước tính hiệu ứng cố định có thể được xem bằng cách gõ summary(g). Lưu ý rằng mô hình này cho phép các hiệu ứng ngẫu nhiên được tương quan tự do với nhau.

Trong nhiều trường hợp, có thể có ý nghĩa hơn (hoặc dễ hiểu hơn) khi thừa nhận sự độc lập giữa các hiệu ứng ngẫu nhiên (ví dụ: giả định này thường được thực hiện để phân tách di truyền so với tương quan gia đình môi trường), trong trường hợp bạn thay vào đó

g <- lmer(y ~ x + (1|famID) + (A-1|famID) + (x-1|famID) +(Ax-1|famID), data=D) 

Đây thực sự là một giải pháp tốt, và tôi thích nó! Sẽ dùng thử sớm, và thấy nó đi ... Cảm ơn rất nhiều!
bluepole

Không có gì. Nếu bạn thấy giải pháp này hữu ích, vui lòng xem xét chấp nhận câu trả lời :)
Macro

Hai vấn đề: 1) Vì hầu hết các đối tượng là cặp song sinh bị chóng mặt, nên cách tiếp cận của bạn dường như không mô hình hóa mối tương quan giữa một cặp sinh đôi DZ. 2) Chỉ có 4 gia đình có thêm anh chị em. Tôi lo lắng sẽ khó có thể ước tính được các tác động ngẫu nhiên cho anh chị em chỉ dựa trên 4 gia đình đó. Vì sự khác biệt giữa cặp sinh đôi DZ và anh chị em khác là tương đối nhỏ (chủ yếu là môi trường, không phải do di truyền), nên tôi có thể đơn giản bỏ qua sự khác biệt tinh tế của sinh đôi so với anh chị em và coi vài anh chị em đó là anh em sinh đôi với hiệu ứng ngẫu nhiên như trong mô hình của bạn hoặc với phần dư tương quan như trong OP của tôi.
bluepole

σ02+σ12σ02+σ12+σε2
Ở đâu σ02,σ12 là phương sai của ηTôi0,ηTôi1, tương ứng và σε2là phương sai của thuật ngữ lỗi. Khi các giá trị dự đoán không bằng 0, biểu thức này cũng sẽ liên quan đến phương sai của hai hiệu ứng ngẫu nhiên khác.
Macro

Bạn nói đúng rằng, vì có một vài người không sinh đôi, nên phương sai của ηTôi0ηTôi2 are going to be difficult to estimate. You can leave them out, but you don't lose anything by using the model I've suggested but possibly computational brevity. If you do, you're effectively assuming that non-twin siblings are independent. But you can still be using those observations to estimate the mean parameters (i.e. don't leave them out of the model fitting). Or, as you said, you can just act as though regular siblings are the same as twins, and you wouldn't need to dummy coding at all.
Macro
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.