Mô hình nguy cơ tỷ lệ Cox và giải thích các hệ số khi có tương tác trường hợp cao hơn


9

Dưới đây là đầu ra tóm tắt của mô hình Coxph mà tôi đã sử dụng (Tôi đã sử dụng R và đầu ra dựa trên mô hình cuối cùng tốt nhất tức là tất cả các biến giải thích quan trọng và các tương tác của chúng được bao gồm):

 coxph(formula = Y ~ LT + Food + Temp2 + LT:Food + LT:Temp2 + 
Food:Temp2 + LT:Food:Temp2) # Y<-Surv(Time,Status==1)

n = 555

               coef         exp(coef)          se(coef)      z           Pr(>|z|)     
LT             9.302e+02      Inf             2.822e+02    3.297        0.000979 *** 
Food           3.397e+03      Inf             1.023e+03    3.321        0.000896 *** 
Temp2          5.016e+03      Inf             1.522e+03    3.296        0.000979 *** 
LT:Food        -2.250e+02    1.950e-98        6.807e+01    -3.305       0.000949 *** 
LT:Temp2       -3.327e+02    3.352e-145       1.013e+02    -3.284       0.001022 ** 
Food:Temp2     -1.212e+03    0.000e+00        3.666e+02    -3.307       0.000942 *** 
LT:Food:Temp2   8.046e+01    8.815e+34        2.442e+01     3.295       0.000986 *** 
--- 
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Rsquare= 0.123   (max possible= 0.858 ) 
Likelihood ratio test= 72.91  on 7 df,   p=3.811e-13 
Wald test            = 55.79  on 7 df,   p=1.042e-09 
Score (logrank) test = 78.57  on 7 df,   p=2.687e-14 

Câu hỏi là:

Làm thế nào để giải thích các giá trị hệ số và exp (coef) trong trường hợp này, vì chúng là các giá trị rất lớn? Ngoài ra tương tác 3 trường hợp có liên quan, mà gây nhầm lẫn giải thích nhiều hơn.

Tất cả các ví dụ liên quan đến mô hình Coxph mà tôi đã tìm thấy cho đến nay trực tuyến thực sự đơn giản về các điều khoản xen kẽ (vốn luôn luôn không đáng kể) và cả các giá trị hệ số (= tỷ lệ nguy hiểm) và các hàm mũ của các tỷ lệ này (= tỷ lệ nguy hiểm) có số lượng khá nhỏ và "dễ xử lý", ví dụ: hệ số = 1,73 -> exp (coef) = 5,64. NHƯNG của tôi là cách số lượng lớn hơn như bạn có thể thấy từ đầu ra tóm tắt (ở trên). Và bởi vì chúng rất lớn, nên dường như chúng không có ý nghĩa gì.

Có vẻ hơi nực cười khi nghĩ rằng tỷ lệ sống sót là ví dụ: 8.815e + 34 (tỷ lệ nguy hiểm được lấy từ tương tác LT: Food: Temp2) thấp hơn khi tương tác tăng thêm một đơn vị (?).

Thật ra tôi cũng không biết cách diễn giải tương tác 3 trường hợp này. Điều đó có nghĩa là khi tất cả các biến trong tương tác tăng thêm một đơn vị, tỷ lệ sống sẽ giảm theo một lượng nhất định (được nói bởi giá trị exp (coef))?

Sẽ thật tuyệt nếu ai đó có thể giúp tôi ra khỏi đây. :)

Dưới đây là một phần của bảng dữ liệu của tôi, tôi đã sử dụng để phân tích cox. Ở đây bạn có thể thấy rằng tôi đã sử dụng nhiều lần cùng một giá trị dao động giải thích (ví dụ LT, Thực phẩm và Temp2) cho một số "Biến phản ứng thời gian, trạng thái". Các giá trị biến giải thích này đã là giá trị trung bình của các biến này (do thiết lập công việc trường ngoài bản chất, không thể có được giá trị biến giải thích riêng cho từng cá nhân phản ứng được quan sát, do đó các giá trị trung bình được sử dụng trong giai đoạn này ) và điều này sẽ trả lời cho gợi ý 1 (?) (xem câu trả lời đầu tiên).

Gợi ý 2 (xem câu trả lời thứ 1): Tôi đang sử dụng R, và tôi chưa phải là siêu thần trong đó. :) Vì vậy, nếu tôi sử dụng chức năng dự đoán (cox.model, type = "dự kiến"), tôi nhận được một lượng lớn các giá trị khác nhau và không biết họ đang đề cập đến biến giải thích nào và theo thứ tự nào. Hoặc có thể làm nổi bật thuật ngữ tương tác nhất định trong chức năng dự đoán? Tôi không chắc chắn nếu tôi đang làm cho mình rất rõ ràng ở đây.

Gợi ý 3 (xem câu trả lời thứ 1): trong phần của bảng dữ liệu bên dưới, người ta có thể thấy các đơn vị của các biến giải thích khác nhau. Chúng đều khác nhau và bao gồm số thập phân. Điều này có thể có một cái gì đó để làm với kết quả cox?

Một phần của bảng dữ liệu:

Time (days)     Status      LT(h) Food (portions per day) Temp2 C)
28                0         14.42        4.46             3.049
22                0         14.42        4.46             3.049
9                 1         14.42        4.46             3.049
24                0         15.33        4.45             2.595
24                0         15.33        4.45             2.595
19                1         15.33        4.45             2.595

Chúc mừng, Unna


@MansT: Rất vui vì bạn đã chỉnh sửa câu hỏi ;-)
ocram

Câu trả lời:


7

Một vài gợi ý, không liên quan trực tiếp đến CoxPH mà liên quan đến tương tác và cộng tác

1) Khi bạn nhận được các giá trị "điên rồ" như thế này, một khả năng là sự cộng tác. Đây thường là một vấn đề khi bạn có tương tác. Bạn đã tập trung tất cả các biến của mình (bằng cách trừ giá trị trung bình từ mỗi biến) chưa?

2) Bạn không thể diễn giải một tương tác giữa nhiều người khá dễ dàng. LT, thực phẩm và temp2 đều tham gia vào nhiều tương tác. Vì vậy, nhìn vào các giá trị dự đoán từ các kết hợp khác nhau.

3) Kiểm tra các đơn vị của các biến khác nhau. Khi bạn nhận được các thông số điên rồ, đôi khi đó là vấn đề của các đơn vị (ví dụ: đo chiều cao của con người tính bằng milimét hoặc km)

4) Khi bạn đã giải quyết được vấn đề đó, tôi thấy cách dễ nhất để nghĩ về tác động của các tương tác khác nhau (đặc biệt là các mức cao hơn) là biểu đồ các giá trị dự đoán với các kết hợp khác nhau của các giá trị độc lập.


Hei, bên dưới là một phần của bảng dữ liệu của tôi, tôi đã sử dụng cho phân tích cox. Ở đây bạn có thể thấy rằng tôi đã sử dụng nhiều lần cùng một giá trị dao động giải thích (ví dụ LT, Thực phẩm và Temp2) cho một số biến phản ứng Thời gian, Trạng thái. Các giá trị biến giải thích này đã là giá trị trung bình của các biến này (do thiết lập công việc trường ngoài bản chất, không thể có được giá trị biến giải thích riêng cho từng cá nhân phản ứng được quan sát, do đó các giá trị trung bình được sử dụng trong giai đoạn này ) và điều này sẽ trả lời cho gợi ý 1 (?).
Unna

Gợi ý 2: Tôi đang sử dụng R, và tôi chưa phải là siêu thần trong đó. :) Vì vậy, nếu tôi sử dụng chức năng dự đoán (cox.model, type = "dự kiến"), tôi nhận được một lượng lớn các giá trị khác nhau và không biết họ đang đề cập đến biến giải thích nào và theo thứ tự nào. Hoặc có thể higlight thuật ngữ tương tác nhất định trong chức năng dự đoán? Tôi không chắc chắn nếu tôi đang làm cho mình rất rõ ràng ở đây.
Unna

Gợi ý 3: trong phần của bảng dữ liệu bên dưới, người ta có thể thấy các đơn vị của các biến giải thích khác nhau. Chúng đều khác nhau và bao gồm số thập phân. Điều này có thể có một cái gì đó để làm với kết quả cox?
Unna

Thời gian (ngày) Tình trạng LT (h) Địa Ốc (phần mỗi ngày) Temp2 (ºC) 28 0 14,42 4,46 3,049 22 0
Unna

Nhận xét trên về ví dụ về bảng dữ liệu mà tôi đã sử dụng không hiển thị trong hình dạng bảng, nhưng tôi hy vọng có thể hiểu ý nghĩa của nó. :)
Unna
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.