Chính xác làm thế nào để coxph () của R xử lý các biện pháp lặp đi lặp lại?


10

Bối cảnh

Tôi đang cố gắng hiểu làm thế nào coxph () của R chấp nhận và xử lý các mục lặp lại cho các đối tượng (hoặc bệnh nhân / khách hàng nếu bạn muốn). Một số người gọi định dạng này là Long, những người khác gọi đó là "các biện pháp lặp lại".

Xem ví dụ: tập dữ liệu bao gồm cột ID trong phần Câu trả lời tại:

Gói tốt nhất cho các mô hình Cox với đồng biến thời gian khác nhau

Ngoài ra, giả sử các biến số là thay đổi theo thời gian trong suốt và có chính xác một biến kiểm duyệt (tức là sự kiện), đó là nhị phân.

Câu hỏi

1) Trong câu trả lời của liên kết ở trên, nếu ID không được cung cấp dưới dạng tham số trong lệnh gọi coxph () thì kết quả có giống như bao gồm cụm (ID) làm tham số trong coxph () không?

Tôi đã cố gắng tìm kiếm tài liệu, nhưng những điều sau đây dường như không giải quyết rõ ràng (1): https://stat.ethz.ch/pipermail/r-help//2013-July3537466.html

2) Nếu câu trả lời cho (1) là 'không', thì (về mặt toán học) tại sao? Dường như cluster () trong coxph () tìm kiếm mối tương quan giữa các chủ thể theo tiểu mục 'cluster' trên pg. 20 tại

https://cran.r-project.org/web/packages/survival/survival.pdf

3) Câu hỏi mơ hồ: làm thế nào coxph () với các biện pháp lặp lại so với các phương pháp hồi quy frailtypack của R?

Phụ lục

Các gợi ý sau khi sử dụng cluster (ID):

Có một phiên bản nhận biết các biện pháp lặp lại của bài kiểm tra logrank không?

cũng như:

https://stat.ethz.ch/pipermail/r-help//2013-July3537466.html

Cách tiếp cận GEE: thêm "+ cluster (chủ đề)" vào câu lệnh mô hình trong coxph Cách tiếp cận mô hình hỗn hợp: Thêm "+ (1 | chủ đề)" vào trạng thái mô hình trong coxme.

Cảm ơn trước!

Câu trả lời:


11
  1. Bao gồm cluster(ID)không thay đổi các ước tính điểm của các tham số. Tuy nhiên, nó thay đổi cách tính các lỗi tiêu chuẩn.

    Thông tin chi tiết có thể được tìm thấy trong cuốn sách của Therneau & Grambsch Mở rộng mô hình Cox , chương 8.2. Lưu ý rằng trong ví dụ của họ, họ sử dụng method = "breslow"làm hiệu chỉnh cho các mối quan hệ, nhưng với mặc định ( method = "efron") một phép tính tương tự cho các se sẽ được sử dụng và xuất hiện trong bản tóm tắt là "mạnh mẽ se".

  2. Nếu cụm (ID) được sử dụng, ước tính "mạnh mẽ" của các lỗi tiêu chuẩn được áp đặt và sự phụ thuộc có thể có giữa các đối tượng được đo (ví dụ: bằng các lỗi tiêu chuẩn và điểm chênh lệch). Không sử dụng cụm (ID), mặt khác, áp đặt tính độc lập cho mỗi quan sát và nhiều "thông tin" được giả định trong dữ liệu. Theo thuật ngữ kỹ thuật hơn, hàm điểm cho các tham số không thay đổi, nhưng phương sai của điểm này thì không. Một lập luận trực quan hơn là 100 quan sát trên 100 cá nhân cung cấp nhiều thông tin hơn 100 quan sát trên 10 cá nhân (hoặc cụm).

  3. Thật mơ hồ. Nói tóm lại, +frailty(ID)trong coxph()cơn mô hình mong manh tiêu chuẩn với gamma hay hiệu ứng ngẫu nhiên log-bình thường và có nguy cơ sở phi tham số / cường độ. frailtypacksử dụng đường cơ sở tham số (cũng là các phiên bản linh hoạt với các hàm spline hoặc piecewise) và cũng phù hợp với các mô hình phức tạp hơn, chẳng hạn như điểm yếu tương quan, điểm yếu lồng nhau, v.v.

Cuối cùng, +cluster()phần nào theo tinh thần của GEE, ở chỗ bạn lấy phương trình điểm từ khả năng quan sát độc lập và sử dụng công cụ ước tính "mạnh mẽ" khác cho các lỗi tiêu chuẩn.

chỉnh sửa: Cảm ơn @Ivan về các đề xuất liên quan đến sự rõ ràng của bài viết.


Cảm ơn bạn. Về (2): có thể "Điều này là do nếu bạn (sai) giả sử ..." được thay thế bằng "Nếu bạn không sử dụng cụm (ID) trong lệnh gọi coxph (), thì bạn giả sử sai ...."
Quetzalcoatl

Ý tôi là: nếu các quan sát được nhóm lại, thì chúng có thể hoặc không thể độc lập. Giả sử rằng họ độc lập (nghĩa là không sử dụng cụm (id)) gần như chắc chắn sai trong trường hợp này, nhưng không có ý tưởng nào biết trước điều đó
Theodor

(2) có thể được đánh giá lại như sau: nếu cụm (ID) được sử dụng, ước tính sai số "mạnh mẽ" được áp đặt và sự phụ thuộc có thể có giữa các đối tượng được đo (ví dụ: bằng lỗi tiêu chuẩn và điểm chênh lệch). Không sử dụng cụm (ID), mặt khác, áp đặt tính độc lập cho mỗi quan sát và nhiều "thông tin" được giả định trong dữ liệu.
Quetzalcoatl

Liên kết tham chiếu bạn cung cấp trong (1) phải là: springer.com/us/book/9780387987842 (giả sử bạn đang trích dẫn cuốn sách của Therneau và Grambsch)
Quetzalcoatl

Cũng lưu ý: như được giải thích trong cuốn sách của Therneau và Grambsch, lý do câu trả lời trong (1) ở trên là chính xác là vì coxph () sử dụng phương thức Breslow làm mặc định cho các mối quan hệ.
Quetzalcoatl

1

Đây là một câu trả lời từ một survivalhọa tiết gói tôi thấy hữu ích - nó được liên kết trong câu trả lời đầu tiên cho câu hỏi đầu tiên bạn liên kết đến:

Gói tốt nhất cho các mô hình Cox với đồng biến thời gian khác nhau

Họ đang đề cập đến thiết lập dữ liệu dạng dài hoặc dữ liệu với các mục nhập lặp lại cho các đối tượng.

Một câu hỏi phổ biến với thiết lập dữ liệu này là liệu chúng ta có cần lo lắng về dữ liệu tương quan hay không, vì một chủ đề nhất định có nhiều quan sát. Câu trả lời là không, chúng tôi thì không. Lý do là đại diện này chỉ đơn giản là một thủ thuật lập trình. Các phương trình khả năng tại bất kỳ thời điểm nào chỉ sử dụng một bản sao của bất kỳ chủ đề nào, chương trình chọn ra hàng dữ liệu chính xác tại mỗi thời điểm. Có hai ngoại lệ cho quy tắc này:

  • Khi các chủ đề có nhiều sự kiện, thì các hàng cho các sự kiện được tương quan trong chủ đề và một phương sai cụm là cần thiết.
  • Khi một chủ đề xuất hiện trong các khoảng chồng chéo. Tuy nhiên, điều này hầu như luôn luôn là một lỗi dữ liệu, vì nó tương ứng với hai bản sao của chủ đề có mặt trong cùng một tầng lớp cùng một lúc, ví dụ, cô ấy có thể gặp mình trong một bữa tiệc.

Ví dụ họ đưa ra là

fit <- coxph(Surv(time1, time2, status) ~ age + creatinine, data=mydata)

đề nghị rằng nếu bạn cung cấp hai lần (bắt đầu và kết thúc giai đoạn) Survthay vì một lần, coxph()sẽ tìm ra phần còn lại.


Trừ khi tôi đã hiểu nhầm điều gì, tôi nghĩ nhận xét này là sai lệch? Chúng ta cần phải lo lắng về dữ liệu tương quan nếu chúng ta muốn có được ước tính chính xác về phương sai, do đó tại sao việc thêm cụm từ + cụm (ID) thay đổi các thuật ngữ phương sai ước tính?
AP30
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.