Đường cong Kaplan-Meier dường như nói khác hơn là hồi quy Cox


9

Trong R, tôi đang làm phân tích dữ liệu sinh tồn của bệnh nhân ung thư.

Tôi đã đọc những thứ rất hữu ích về phân tích sinh tồn ở CrossValidated và những nơi khác và nghĩ rằng tôi hiểu cách diễn giải kết quả hồi quy Cox. Tuy nhiên, một kết quả vẫn khiến tôi ...

Tôi đang so sánh sự sống còn với giới tính. Các đường cong Kaplan-Meier rất có lợi cho bệnh nhân nữ (tôi đã kiểm tra nhiều lần rằng truyền thuyết tôi đã thêm là chính xác, bệnh nhân có khả năng sống sót tối đa, 4856 ngày, thực sự là phụ nữ): nhập mô tả hình ảnh ở đây

Và hồi quy Cox đang trở lại:

Call:
coxph(formula = survival ~ gender, data = Clinical)

  n= 348, number of events= 154 

              coef exp(coef) se(coef)      z Pr(>|z|)  
gendermale -0.3707    0.6903   0.1758 -2.109    0.035 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

           exp(coef) exp(-coef) lower .95 upper .95
gendermale    0.6903      1.449    0.4891    0.9742

Concordance= 0.555  (se = 0.019 )
Rsquare= 0.012   (max possible= 0.989 )
Likelihood ratio test= 4.23  on 1 df,   p=0.03982
Wald test            = 4.45  on 1 df,   p=0.03499
Score (logrank) test = 4.5  on 1 df,   p=0.03396

Vì vậy, Tỷ lệ Nguy hiểm (HR) cho bệnh nhân nam ( gendermale) là 0,6903. Cách tôi giải thích rằng (không cần nhìn vào đường cong Kaplan-Meier) là: vì HR là <1, là một bệnh nhân của giới tính nam là bảo vệ. Hay chính xác hơn, một bệnh nhân nữ là 1 / 0,6903 = exp (-coef) = 1,449 có khả năng tử vong cao hơn vào bất kỳ thời điểm cụ thể nào so với nam giới.

Nhưng điều đó dường như không giống với những gì đường cong Kaplan-Meier nói! Có gì sai với cách giải thích của tôi?


3
Từ đường cong KM của bạn, có vẻ như giả định PH của hồi quy Cox không được giữ.
Sâu Bắc

Tôi hiểu rồi. Tôi chưa từng nhìn vào điều đó trước đây! Về mặt đồ họa, điều đó có nghĩa là các đường cong Kaplan-Meier của tôi phải song song để tôi có thể sử dụng Cox một cách an toàn, phải không? Điều đó dường như ít nhiều OK trước ~ 2200 ngày. Có ổn không khi xem kết quả Cox cho tất cả dữ liệu một chút trước giao lộ?
francoiskroll

4
NB Đó là các đường cong , trong đó là hàm sống sót ước tính cho nhóm , nên song song với các mối nguy theo tỷ lệ. Như @IWS chỉ ra, khoảng tin cậy sẽ rất rộng đối với nhóm nữ sau khoảng 3000 ngày (chỉ có hai người vượt qua điểm đó?) Vì vậy giả định PH có thể không quá tệ. S i ( t ) iloglogS^i(t)S^i(t)i
Scortchi - Phục hồi Monica

@DeepNorth: Tôi không thực sự thấy bằng chứng mạnh mẽ chống lại các mối nguy theo tỷ lệ. Vâng, các đường cong chồng chéo về mặt kỹ thuật ... nhưng đó là trên các đuôi cực đoan.
Vách đá AB

Để bổ sung cho các câu trả lời và nhận xét khác, hãy so sánh tỷ lệ sống trung bình hoặc tỷ lệ sống 5 năm đối với nam và nữ. Có một lợi ích rõ ràng cho nam giới trong dữ liệu này phù hợp với phân tích Cox PH.
Itamar

Câu trả lời:


12

Đây là một ví dụ rất hay về các mối nguy không theo tỷ lệ HOẶC ảnh hưởng của 'sự cạn kiệt' trong phân tích sinh tồn. Tôi sẽ cố gắng để giải thích.

Đầu tiên hãy nhìn vào đường cong Kaplan-Meier (KM) của bạn: bạn có thể thấy trong phần đầu tiên (cho đến khoảng 3000 ngày), tỷ lệ nam giới vẫn còn sống trong dân số có nguy cơ tại thời điểm t lớn hơn tỷ lệ nữ (tức là đường màu xanh là 'cao hơn' so với đường màu đỏ). Điều này có nghĩa là giới tính nam thực sự là 'bảo vệ' cho sự kiện (cái chết) được nghiên cứu. Theo đó, tỷ lệ nguy hiểm phải nằm trong khoảng từ 0 đến 1 (và hệ số phải âm).

Tuy nhiên, sau ngày 3000, đường màu đỏ cao hơn! Điều này thực sự sẽ đề nghị ngược lại. Chỉ dựa trên biểu đồ KM này, điều này sẽ gợi ý thêm một mối nguy không theo tỷ lệ. Trong trường hợp này, 'không tỷ lệ' có nghĩa là ảnh hưởng của biến độc lập (giới tính) của bạn không phải là hằng số theo thời gian. Nói cách khác, tỷ lệ nguy hiểm có thể thay đổi khi thời gian tiến triển. Như đã giải thích ở trên, điều này có vẻ như trường hợp. Mô hình Cox nguy hiểm theo tỷ lệ thường xuyên không chứa các hiệu ứng như vậy. Trên thực tế, một trong những giả định chính là các mối nguy hiểm tỷ lệ thuận! Bây giờ bạn thực sự có thể mô hình hóa các mối nguy không theo tỷ lệ, nhưng điều đó nằm ngoài phạm vi của câu trả lời này.

Có thêm một nhận xét để thực hiện: sự khác biệt này có thể là do các mối nguy hiểm thực sự không theo tỷ lệ hoặcthực tế là có rất nhiều phương sai trong các ước tính đuôi của các đường cong KM. Lưu ý rằng tại thời điểm này, toàn bộ nhóm 349 bệnh nhân sẽ giảm xuống một dân số rất nhỏ vẫn có nguy cơ. Như bạn có thể thấy, cả hai nhóm giới đều có bệnh nhân trải qua sự kiện và bệnh nhân bị kiểm duyệt (các đường thẳng đứng). Khi dân số có nguy cơ giảm, các ước tính tỷ lệ sống sẽ trở nên ít chắc chắn hơn. Nếu bạn đã vẽ khoảng tin cậy 95% xung quanh các đường KM, bạn sẽ thấy độ rộng của khoảng tin cậy tăng lên. Điều này cũng quan trọng cho việc ước tính các mối nguy hiểm. Nói một cách đơn giản, vì dân số có nguy cơ và số lượng sự kiện trong giai đoạn cuối của nghiên cứu của bạn thấp, giai đoạn này sẽ đóng góp ít hơn cho các ước tính trong mô hình cox ban đầu của bạn.

Cuối cùng, điều này sẽ giải thích tại sao mối nguy hiểm (giả định không đổi theo thời gian) phù hợp hơn với phần đầu tiên của KM của bạn, thay vì điểm cuối cùng.

EDIT: xem bình luận tại chỗ của @ Scrotchi cho câu hỏi ban đầu: Như đã nêu, ảnh hưởng của số lượng thấp trong giai đoạn cuối của nghiên cứu là các ước tính về các mối nguy hiểm tại những thời điểm đó là không chắc chắn. Do đó, bạn cũng ít chắc chắn hơn nếu vi phạm rõ ràng về giả định mối nguy theo tỷ lệ không phải là do tình cờ. Như các tiểu bang của @ Scrotchi, giả định PH có thể không tệ đến thế.


1
(-1) Các đuôi vắt chéo ở cực cuối, nơi chúng ta có rất ít dữ liệu. Trên thực tế, bằng chứng cho "mối nguy không tỷ lệ" chỉ dựa trên hai quan sát (tức là khi t> 2800, chỉ có hai đối tượng còn lại trong đoàn hệ nữ và bên cạnh đó, sự kiện cuối cùng trước đó trong nhóm là xung quanh t = 2100)
Vách đá AB

2
@CliffAB Cảm ơn phản hồi Cliff AB. Tôi có một chút bối rối, mặc dù nhận xét của bạn là chính xác những gì tôi đã cố gắng nói. Tôi sẽ thừa nhận: nó có thể đã ngắn hơn một chút. -1 là một chút khó khăn mặc dù: '(
IWS

2
có lẽ đó là một chút ý nghĩa của tôi. Điểm duy nhất của tôi là khi tôi nhìn vào điều này, tôi không nhất thiết phải thấy một ví dụ điển hình về các mối nguy không theo tỷ lệ, mà là rất ít dữ liệu trên các đuôi. Tôi thấy câu đầu tiên đã được sửa đổi (tôi nghĩ trừ khi tôi bỏ lỡ điều này lần đầu tiên?) Để giải quyết, vì vậy bây giờ (-1) chắc chắn không được sử dụng.
Vách đá AB

1
Rất tiếc, có vẻ như tôi đã bỏ lỡ lần đầu tiên. Lấy làm tiếc!
Vách đá AB

Không có vấn đề gì, ít nhất chúng tôi đồng ý với câu trả lời: D
IWS

5

Bạn đang bối rối về bản chất của đầu ra của bạn. Những dữ liệu này nói: Nếu bạn là nam, bạn có khả năng sống lâu hơn nữ; Con cái có tỷ lệ sống sót cao hơn con đực. Điều này được phản ánh trong đầu ra hồi quy vì hiệu ứng của MALE là có tỷ lệ rủi ro log âm, ví dụ nam có rủi ro thấp hơn nữ. Tại hầu hết các thời điểm sự kiện (khi các đường cong "bước"), đường cong sinh tồn của nam giới lớn hơn so với nữ giới, kết quả và biểu đồ mô hình Cox rất phù hợp. Các đường cong KM xác nhận điều này cũng như đầu ra mô hình hồi quy. "Thập giá" là một không quan trọng.

Đường cong KM hoạt động kém ở đuôi, đặc biệt là khi chúng gần 0% và / hoặc giảm dần. Trục Y là tỷ lệ sống sót. Với tương đối ít người sống sót trong nghiên cứu và ít người chết vào thời điểm đó, độ tin cậy của các ước tính là trực quan và đồ họa khủng khiếp. Tôi lưu ý, chẳng hạn, có rất ít nữ giới trong đoàn hệ của bạn so với nam giới sau 2.800 ngày, có ít hơn 10 nữ còn lại trong đoàn hệ, bằng chứng là các bước trong đường cong sinh tồn và thiếu các sự kiện bị kiểm duyệt.

Một lưu ý thú vị, bởi vì các phân tích sinh tồn sử dụng các đường cong KM, kiểm tra thứ hạng nhật ký và các mô hình Cox sử dụng thời gian sống sót được xếp hạng , thời gian sống sót thực tế có phần không liên quan. Người phụ nữ sống sót lâu nhất của bạn có thể, còn nguyên vẹn, đã sống sót thêm 100 năm nữa và nó sẽ không ảnh hưởng gì đến các phân tích. Điều này là do chức năng nguy hiểm cơ bản (không quan sát thấy bất kỳ sự kiện nào trong 13 năm qua) sẽ cho rằng không có nguy cơ tử vong trong 87 năm tiếp theo kể từ khi không có ai chết sau đó.

Nếu bạn muốn có một HR mạnh mẽ để có được 95% CIs và giá trị p chính xác cho điều này, hãy chỉ định robust=TRUEtrong Cox-PH để có được các lỗi tiêu chuẩn sandwich. Trong trường hợp đó, HR là một HR trung bình theo thời gian so sánh nam giới với nữ giới trong mọi thời điểm thất bại.


Để làm rõ: Trong cốt truyện KM, con đực có khả năng sống sót tốt hơn lên tới khoảng 2700 ngày. Sau đó, phụ nữ có sự sống sót tốt hơn. Nhưng cái đuôi đó không chính xác vì có quá ít dữ liệu ngoài kia. Bạn có thể thấy rằng hai bước trong đường cong KM đưa tỷ lệ sống của nữ từ khoảng 35% xuống 0%, do đó rất có thể là hai người. Sẽ rất hữu ích khi vẽ đường cong KM bằng các dải tin cậy. Sau đó, tôi đoán rằng bạn sẽ thấy sự tách biệt rõ ràng lên đến khoảng 2000 ngày và sau đó trùng lặp sau đó.
Harvey Motulsky

2
@HarveyMotulsky đúng nhưng đuôi của KM rất không đáng tin cậy. Nếu OP thu hút được các TCTD, họ sẽ chồng chéo mạnh mẽ, do đó, theo suy luận, chúng tôi sẽ nói rằng sự sống sót có lẽ là không rõ ràng sau 2.700 ngày.
AdamO

Chính xác quan điểm của tôi. Dữ liệu cho thấy rõ ràng rằng con đực (trong tình huống này, dù nó là gì) có khả năng sống sót tốt hơn ít nhất trong hơn 2000 ngày đầu tiên.
Harvey Motulsky
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.