Trong phân tích sinh tồn, tại sao chúng ta sử dụng các mô hình bán tham số (mối nguy theo tỷ lệ Cox) thay vì mô hình tham số đầy đủ?


24

Tôi đã nghiên cứu mô hình Nguy cơ theo tỷ lệ Cox và câu hỏi này được đưa ra trong hầu hết các văn bản.

Cox đề xuất điều chỉnh các hệ số của hàm Hazard bằng phương pháp xác suất từng phần, nhưng tại sao không chỉ phù hợp với các hệ số của hàm Survival tham số bằng phương pháp khả năng tối đa và mô hình tuyến tính?

Trong mọi trường hợp bạn đã kiểm duyệt dữ liệu, bạn chỉ có thể tìm thấy khu vực dưới đường cong. Ví dụ: nếu ước tính của bạn là 380 với độ lệch chuẩn là 80 và một mẫu được kiểm duyệt> 300, thì có xác suất 84% cho mẫu đó trong tính toán khả năng giả sử sai số bình thường.


Tôi muốn có nhiều câu hỏi về khoa học chuyên gia tính toán ở đây, tôi phải nói rằng câu hỏi này có lẽ sẽ nhận được phản hồi tốt hơn trong trang thống kê, Xác thực chéo. Bạn có thể yêu cầu người điều hành di chuyển nó.
Đồ thị

Được rồi, không nhận ra rằng đã tồn tại. Không chắc chắn làm thế nào để yêu cầu di chuyển. Hãy di chuyển?

@Graphth, tôi cũng không nhận ra có một ... Tôi không tìm thấy nó trong danh sách "tất cả các trang web", bạn có thể liên kết với nó ở đây không? Cảm ơn

Câu trả lời:


27

Nếu bạn biết phân phối tham số mà dữ liệu của bạn tuân theo thì sử dụng phương pháp khả năng tối đa và phân phối có ý nghĩa. Ưu điểm thực sự của hồi quy Nguy hiểm theo tỷ lệ Cox là bạn vẫn có thể phù hợp với các mô hình sinh tồn mà không cần biết (hoặc giả định) phân phối. Bạn đưa ra một ví dụ bằng cách sử dụng phân phối bình thường, nhưng hầu hết thời gian tồn tại (và các loại dữ liệu khác mà hồi quy Cox PH được sử dụng) không đến gần với phân phối bình thường. Một số có thể tuân theo log-normal, hoặc Weibull hoặc phân phối tham số khác và nếu bạn sẵn sàng đưa ra giả định đó thì phương pháp tham số khả năng tối đa là rất tốt. Nhưng trong nhiều trường hợp trong thế giới thực, chúng ta không biết phân phối thích hợp là gì (hoặc thậm chí là một xấp xỉ đủ gần). Với việc kiểm duyệt và đồng biến, chúng ta không thể thực hiện một biểu đồ đơn giản và nói rằng "nó trông giống như một ... bản phân phối cho tôi". Vì vậy, rất hữu ích để có một kỹ thuật hoạt động tốt mà không cần phân phối cụ thể.

Tại sao sử dụng các mối nguy hiểm thay vì chức năng phân phối? Hãy xem xét tuyên bố sau: "Những người trong nhóm A có khả năng chết gấp đôi ở tuổi 80 so với những người trong nhóm B". Bây giờ điều đó có thể đúng bởi vì những người trong nhóm B có xu hướng sống lâu hơn những người trong nhóm A, hoặc có thể là do những người trong nhóm B có xu hướng sống cuộc sống ngắn hơn và hầu hết trong số họ đã chết rất lâu trước 80 tuổi, đưa ra một xác suất rất nhỏ trong số họ chết ở tuổi 80 trong khi đủ số người trong nhóm A sống đến 80 rằng một số lượng khá lớn trong số họ sẽ chết ở tuổi đó với xác suất tử vong cao hơn nhiều ở độ tuổi đó. Vì vậy, cùng một tuyên bố có thể có nghĩa là ở nhóm A tốt hơn hoặc xấu hơn so với ở nhóm B. Điều có ý nghĩa hơn là nói về những người đó (trong mỗi nhóm) sống đến 80, tỷ lệ nào sẽ chết trước khi họ 81 tuổi. Đó là mối nguy hiểm (và mối nguy hiểm là một chức năng của chức năng phân phối / chức năng sinh tồn / v.v.). Nguy hiểm dễ làm việc hơn trong mô hình bán tham số và sau đó có thể cung cấp cho bạn thông tin về phân phối.


7
Câu trả lời tốt đẹp. Điều độc đáo về thời gian là nó đi theo một hướng, và một khi chúng ta đã chịu đựng được thời kỳ rủi ro cao, chúng ta chủ yếu quan tâm đến rủi ro hiện có hiệu lực. Đó là những gì chức năng nguy hiểm nói với chúng ta.
Frank Harrell

2
Một điểm đáng để bổ sung là với dữ liệu bị kiểm duyệt, việc kiểm tra các giả định phân phối có thể rất khó khăn. Ví dụ: giả sử chỉ có 20% đối tượng của bạn quan sát một sự kiện. Cố gắng xác định xem các đuôi của phân phối có tuân theo phân phối Weibull rõ ràng là không thể thực hiện được hay không! Mô hình Cox-PH phần nào khắc phục được vấn đề (nhưng bạn phải hết sức cảnh giác với giả định về các mối nguy theo tỷ lệ nếu bạn muốn ngoại suy đến các khu vực có thời gian bị kiểm duyệt cao)
Cliff AB

16

"Chúng tôi" không nhất thiết phải như vậy. Phạm vi của các công cụ phân tích sinh tồn nằm trong phạm vi hoàn toàn không tham số, như phương pháp Kaplan-Meier, đến các mô hình tham số đầy đủ trong đó bạn chỉ định phân phối mối nguy tiềm ẩn. Mỗi cái đều có ưu điểm và nhược điểm.

Các phương pháp bán tham số, như mô hình mối nguy theo tỷ lệ Cox, cho phép bạn thoát khỏi việc không chỉ định chức năng nguy hiểm tiềm ẩn. Điều này có thể hữu ích, vì chúng ta không luôn biết chức năng nguy hiểm tiềm ẩn và trong nhiều trường hợp cũng không quan tâm . Ví dụ, nhiều nghiên cứu dịch tễ học muốn biết "Liệu tiếp xúc X có làm giảm thời gian cho đến khi có sự kiện Y không?" Điều họ quan tâm là sự khác biệt ở những bệnh nhân mắc X và không có X. Trong trường hợp đó, nguy cơ tiềm ẩn không thực sự quan trọng và nguy cơ sai chính tả còn tệ hơn cả hậu quả của việc không biết.

Tuy nhiên, có những lúc điều này cũng không đúng. Tôi đã thực hiện công việc với các mô hình tham số đầy đủ vì mối nguy hiểm tiềm ẩn mối quan tâm.


1
"... và nguy cơ sai chính tả nó còn tồi tệ hơn hậu quả của việc không biết điều đó." Điều này rất hữu ích, cảm ơn bạn.

Bạn có thể đưa ra một ví dụ khi nguy cơ tiềm ẩn được quan tâm?
Dan Chaltiel

1
@DanChaltiel Bất kỳ ước tính nào dự định đi vào một mô hình toán học hoặc tương tự sẽ là một ví dụ - hàm nguy hiểm tiềm ẩn có mối quan tâm đặc biệt.
Fomite
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.