Lựa chọn trọng số đường dẫn trong các mô hình khái niệm SEM cho cặp song sinh giống hệt và anh em bằng cách sử dụng openMx


10

Tôi đang xem xét gói R OpenMx để phân tích dịch tễ di truyền để tìm hiểu cách chỉ định và điều chỉnh các mô hình SEM. Tôi mới làm điều này vì vậy hãy chịu đựng với tôi. Tôi đang theo dõi ví dụ trên trang 59 của Hướng dẫn sử dụng OpenMx . Ở đây họ vẽ mô hình khái niệm sau:

Mô hình SEM cho cặp song sinh giống hệt và anh em

Và khi chỉ định các đường dẫn, họ đặt trọng số của nút "một" tiềm ẩn thành các nút bmi được biểu hiện "T1" và "T2" là 0,6 vì:

Các đường dẫn quan tâm chính là các đường dẫn từ mỗi biến tiềm ẩn đến biến quan sát tương ứng. Chúng cũng được ước tính (do đó tất cả đều được đặt miễn phí), nhận giá trị bắt đầu là 0,6 và nhãn phù hợp.

# path coefficients for twin 1
mxPath(
  from=c("A1","C1","E1"),
  to="bmi1",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

# path coefficients for twin 2
mxPath(
  from=c("A2","C2","E2"),
  to="bmi2",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

Giá trị 0,6 xuất phát từ hiệp phương sai ước tính bmi1bmi2(của các cặp sinh đôi hợp tử đơn cực nghiêm ngặt ). Tôi có hai câu hỏi:

  1. Khi họ nói rằng đường dẫn được đưa ra giá trị "bắt đầu" là 0,6, có giống như đặt thói quen tích hợp số với các giá trị ban đầu, như trong ước tính GLM không?

  2. Tại sao giá trị này được ước tính đúng từ cặp song sinh đơn nhân?

Câu trả lời:


4

Để trả lời 2 điểm của bạn:

1) Có, chính xác - giá trị bắt đầu chỉ đơn thuần là chỉ ra nơi thuật toán sẽ bắt đầu quá trình tối ưu hóa. Hầu hết các gói phần mềm thực sự xác định giá trị bắt đầu của riêng chúng theo mặc định và người dùng cần thử nhập các giá trị khác nhau chỉ khi xảy ra sự cố trong quá trình ước tính. Từ kinh nghiệm của tôi, hầu hết các giá trị bắt đầu hợp lý sẽ làm và sẽ không thay đổi mô hình cuối cùng mà thuật toán hội tụ.

2) Giá trị 0,6 là giá trị bắt đầu không dành cho giao thoa của T1 và T2 (đường dẫn giữa "một" và T1 & T2), nhưng thay vào đó, giá trị bắt đầu cho các hệ số tải liên kết với từng biến tiềm ẩn (A, C, E ) để chỉ báo của họ T1 hoặc T2. Điều này được chỉ ra bởi thực tế là đường dẫn đi from=c("A1","C1","E1"), to="bmi1"trong trường hợp đầu tiên và from=c("A2","C2","E2"), to="bmi2"trong trường hợp thứ hai.

Đối với giá trị cụ thể "0,6": Tôi không thể tìm thấy trong tài liệu mà họ đề cập đến việc lấy giá trị này dựa trên phân nhóm sinh đôi đơn nhân; và trên thực tế, các ước tính tham số này (tải nhân tố cho 3 biến tiềm ẩn) không thể được tính trực tiếp từ mẫu, vì theo định nghĩa, các biến tiềm ẩn này không được quan sát (chúng là tiềm ẩn). Như tôi đã đề cập ở điểm # 1, hiếm khi sự lựa chọn giữa hai giá trị hợp lý sẽ ảnh hưởng đến ước tính tham số của mô hình hội tụ, vì vậy tôi đoán rằng họ chỉ đơn giản chọn một trong nhiều giá trị hợp lý cho các tải nhân tố này làm giá trị bắt đầu. Liệu giá trị này có xuất phát từ hiệp phương sai ước tính giữa bmi1 và bmi2 trong phân nhóm sinh đôi đơn nhân hay không chỉ là không liên quan, vì bất kỳ giá trị bắt đầu hợp lý nào cũng sẽ dẫn đến thuật toán hội tụ cùng các giá trị cuối cùng, có lẽ với một số khác biệt về thời gian tính toán. (Và lời khuyên của tôi để thuyết phục bản thân là: hãy thử nó! Hãy thử một vài giá trị bắt đầu và so sánh các ước tính tham số của các mô hình hội tụ.)

Như một lưu ý chung, tôi sẽ chỉ ra rằng việc lựa chọn các giá trị bắt đầu cho bất kỳ ước tính tham số nào sẽ trở nên RẤT quan trọng nếu đối số freeđược đặt thành FALSE, bởi vì giá trị bắt đầu sẽ thực sự trở thành giá trị của ước tính tham số trong mô hình cuối cùng (nó sẽ không được ước tính, nó được cố định trước khi ước tính).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.