Đây là một vấn đề khiến tôi lo lắng trong một thời gian dài và tôi không tìm thấy câu trả lời hay trong sách giáo khoa, Google hay Stack Exchange.
Tôi có bộ dữ liệu> 100.000 bệnh nhân trong đó bốn phương pháp điều trị đang được so sánh. Câu hỏi nghiên cứu là liệu sự sống còn có khác nhau giữa các phương pháp điều trị này hay không sau khi điều chỉnh một loạt các biến số lâm sàng / nhân khẩu học. Đường cong KM chưa được điều chỉnh nằm bên dưới.
Các mối nguy không theo tỷ lệ được biểu thị bằng mọi phương pháp tôi đã sử dụng (ví dụ: các đường cong sinh tồn log-log chưa được điều chỉnh cũng như tương tác với thời gian và mối tương quan của phần dư Schoenfield và thời gian tồn tại được xếp hạng, dựa trên các mô hình Cox PH đã điều chỉnh). Đường cong sinh tồn log-log bên dưới. Như bạn có thể thấy, hình thức không tương xứng là một mớ hỗn độn. Mặc dù không có sự so sánh nào trong hai nhóm sẽ quá khó để xử lý một cách cô lập, nhưng thực tế là tôi có sáu so sánh thực sự làm tôi bối rối. Tôi đoán là tôi sẽ không thể xử lý mọi thứ trong một mô hình.
Tôi đang tìm kiếm các khuyến nghị về những gì cần làm với những dữ liệu này. Việc mô hình hóa các hiệu ứng này bằng cách sử dụng mô hình Cox mở rộng có khả năng là không thể đưa ra số lượng so sánh và các dạng không tương xứng khác nhau. Cho rằng họ quan tâm đến sự khác biệt trong điều trị, một mô hình phân tầng tổng thể không phải là một lựa chọn vì nó sẽ không cho phép tôi ước tính những khác biệt này.
Vì vậy, hãy thoải mái tách tôi ra, nhưng tôi đã suy nghĩ về việc ước tính ban đầu một mô hình phân tầng để có được hiệu ứng của các hiệp phương sai khác (tất nhiên là kiểm tra giả định không tương tác), và sau đó ước tính lại các mô hình Cox đa biến riêng biệt cho từng mô hình so sánh hai nhóm (vì vậy, 6 mô hình tổng). Bằng cách này, tôi có thể giải quyết hình thức không tương xứng cho mỗi so sánh hai nhóm và nhận được một HR ước tính ít sai. Tôi hiểu rằng các lỗi tiêu chuẩn sẽ bị sai lệch, nhưng với kích thước mẫu, mọi thứ có thể sẽ có ý nghĩa "thống kê".