Khuyến nghị cho các mối nguy không theo tỷ lệ


7

Đây là một vấn đề khiến tôi lo lắng trong một thời gian dài và tôi không tìm thấy câu trả lời hay trong sách giáo khoa, Google hay Stack Exchange.

Tôi có bộ dữ liệu> 100.000 bệnh nhân trong đó bốn phương pháp điều trị đang được so sánh. Câu hỏi nghiên cứu là liệu sự sống còn có khác nhau giữa các phương pháp điều trị này hay không sau khi điều chỉnh một loạt các biến số lâm sàng / nhân khẩu học. Đường cong KM chưa được điều chỉnh nằm bên dưới.

nhập mô tả hình ảnh ở đây

Các mối nguy không theo tỷ lệ được biểu thị bằng mọi phương pháp tôi đã sử dụng (ví dụ: các đường cong sinh tồn log-log chưa được điều chỉnh cũng như tương tác với thời gian và mối tương quan của phần dư Schoenfield và thời gian tồn tại được xếp hạng, dựa trên các mô hình Cox PH đã điều chỉnh). Đường cong sinh tồn log-log bên dưới. Như bạn có thể thấy, hình thức không tương xứng là một mớ hỗn độn. Mặc dù không có sự so sánh nào trong hai nhóm sẽ quá khó để xử lý một cách cô lập, nhưng thực tế là tôi có sáu so sánh thực sự làm tôi bối rối. Tôi đoán là tôi sẽ không thể xử lý mọi thứ trong một mô hình.

nhập mô tả hình ảnh ở đây

Tôi đang tìm kiếm các khuyến nghị về những gì cần làm với những dữ liệu này. Việc mô hình hóa các hiệu ứng này bằng cách sử dụng mô hình Cox mở rộng có khả năng là không thể đưa ra số lượng so sánh và các dạng không tương xứng khác nhau. Cho rằng họ quan tâm đến sự khác biệt trong điều trị, một mô hình phân tầng tổng thể không phải là một lựa chọn vì nó sẽ không cho phép tôi ước tính những khác biệt này.

Vì vậy, hãy thoải mái tách tôi ra, nhưng tôi đã suy nghĩ về việc ước tính ban đầu một mô hình phân tầng để có được hiệu ứng của các hiệp phương sai khác (tất nhiên là kiểm tra giả định không tương tác), và sau đó ước tính lại các mô hình Cox đa biến riêng biệt cho từng mô hình so sánh hai nhóm (vì vậy, 6 mô hình tổng). Bằng cách này, tôi có thể giải quyết hình thức không tương xứng cho mỗi so sánh hai nhóm và nhận được một HR ước tính ít sai. Tôi hiểu rằng các lỗi tiêu chuẩn sẽ bị sai lệch, nhưng với kích thước mẫu, mọi thứ có thể sẽ có ý nghĩa "thống kê".


Bạn đã thử điều chỉnh các biến lâm sàng / nhân khẩu học với điểm số xu hướng thay vì hồi quy Cox chưa? Với sự giàu có của xu hướng dữ liệu này, việc kết hợp điểm có thể khả thi.
EdM

@EdM Không dành cho những dữ liệu này. Sự không chắc chắn của tôi về chính xác làm thế nào để điểm số phù hợp với nhiều dữ liệu danh mục (nghĩa là> 2 danh mục) đã ngăn tôi thử phương pháp này. Tuy nhiên, theo kinh nghiệm của tôi, kết quả phân tích đa biến sẽ rất giống với kết quả phân tích phù hợp với điểm số (do mục đích của cả hai là nhằm giải quyết sai lệch lựa chọn). Vì vậy, tôi sẽ nghi ngờ rằng tôi sẽ kết thúc với cùng một vấn đề không tương xứng.
Ryan W.

Đó là cho bối rối không kết quả không đồng nhất.
Frank Mitchell

Câu trả lời:


3

Câu hỏi tuyệt vời câu trả lời tuyệt vời. Tôi sẽ nói thêm rằng bạn nên xem xét một mô hình đưa ra nhiều giả định khác nhau, chẳng hạn như mô hình sinh tồn logic. Sử dụng hàm nghịch đảo thông thường cho y_axis thay vì log-log. Vẫn cần điều chỉnh đồng biến. Vì vậy, cũng nhìn vào sự bình thường của phần dư được phân tầng bằng cách điều trị. Điều này được đề cập trong một nghiên cứu trường hợp gần cuối ghi chú khóa học của tôi tại http://biostat.mc.vanderbilt.edu/rms


Cảm ơn sự sáng suốt của bạn; Tôi đã không xem xét các mô hình tham số. Tôi thực hiện hầu hết mô hình của mình trong SAS, vì vậy các ghi chú khóa học của bạn cho thấy cách ước tính mô hình log-normal bằng gói rms là vô cùng hữu ích. Mặc dù sự phù hợp của mô hình log-normal không lý tưởng, tôi tin rằng nó đủ và đủ để báo cáo ( Residuals ). PI chắc chắn sẽ cần phải được nhắc nhở rằng một nghiên cứu duy nhất không có nghĩa là dứt khoát. Cảm ơn một lần nữa.
Ryan W.

5

Bạn chắc chắn không có mối nguy theo tỷ lệ cận biên . Điều đó không có nghĩa là bạn không có các mối nguy theo tỷ lệ có điều kiện !

Để giải thích sâu hơn, hãy xem xét tình huống sau: giả sử chúng ta có nhóm 1, rất đồng nhất và có nguy cơ không đổi = 1. Bây giờ trong nhóm hai, chúng ta có một quần thể không đồng nhất; 50% có nguy cơ thấp hơn nhóm 1 (risk = 0,5) và phần còn lại có nguy cơ cao hơn nhóm 1 (risk = 3). Rõ ràng, nếu chúng ta biết liệu mọi người trong nhóm 2 là đối tượng có rủi ro cao hơn hay thấp hơn, thì mọi người sẽ có những mối nguy theo tỷ lệ. Đây là mối nguy hiểm có điều kiện.

Nhưng hãy giả sử rằng chúng ta không biết (hoặc bỏ qua) liệu ai đó trong nhóm 2 có nguy cơ cao hay thấp. Sau đó, phân phối biên cho chúng là mô hình hỗn hợp: 50% khả năng chúng có nguy cơ = 0,5, 50% chúng có nguy hiểm = 3. Dưới đây, tôi cung cấp một số mã R cùng với một âm mưu của hai mối nguy hiểm.

# Function for computing the hazards from 
# a 50/50 heterogenious population
mix_hazard <- function(x, hzd1 = 0.5, hzd2 = 3){
  x_dens <- 0.5 * dexp(x, hzd1) + 0.5 * dexp(x, hzd2)
  x_s    <- 1 - ( 0.5 * pexp(x, hzd1) + 0.5 * pexp(x, hzd2)) 
  hzd    <- x_dens/x_s
  return(hzd)
}

x <- 0:100/20
plot(x, mix_hazard(x), 
     type = 'l',
     col = 'purple', ylim = c(0, 2), 
     xlab = 'Time', 
     ylab = 'Hazard', 
     lwd = 2)
lines(x, rep(1, length(x)), col = 'red', lwd = 2)

legend('topright', 
       legend = c('Homogeneous',
                  'Heterogeneous'), 
       lwd = 2,
       col = c('red', 'purple'))

nhập mô tả hình ảnh ở đây

Chúng tôi thấy rõ mối nguy hiểm cận biên không tỷ lệ! Nhưng lưu ý rằng nếu chúng ta biết liệu các đối tượng trong nhóm 2 là đối tượng rủi ro cao hay rủi ro thấp, chúng ta sẽ có các mối nguy theo tỷ lệ.

Vậy điều này ảnh hưởng đến bạn như thế nào? Vâng, bạn đã đề cập rằng bạn có rất nhiều đồng biến khác về các chủ đề này. Rất có thể khi chúng ta bỏ qua các đồng biến này, các mối nguy hiểm không theo tỷ lệ, nhưng sau khi điều chỉnh chúng, bạn có thể nắm bắt được các nguyên nhân của sự không đồng nhất trong các nhóm khác nhau và khắc phục vấn đề rủi ro không theo tỷ lệ của bạn.


1
Cảm ơn bạn đã trả lời! Quan điểm của bạn được thực hiện tốt vì vấn đề đồng biến bị thiếu có thể biểu hiện thành các mối nguy không theo tỷ lệ. Tôi quên đề cập rằng, mặc dù các đường cong sinh tồn của log-log không được điều chỉnh, tôi đã thử nghiệm tính không tương xứng bằng cách sử dụng các tương tác với thời gian cũng như phần dư Schoenfield sau khi điều chỉnh cho tất cả các đồng biến quan tâm. Tôi đã chỉnh sửa bài viết của mình để phản ánh điều này.
Ryan W.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.