Làm thế nào để thực hiện bài kiểm tra xếp hạng có chữ ký của Wilcoxon cho dữ liệu sinh tồn trong R?


9

Giả sử bạn có dữ liệu sinh tồn như thế này:

obs <- data.frame(
  time = c(floor(runif(100) * 30), floor((runif(100)^2) * 30)),
  status = c(rbinom(100, 1, 0.2), rbinom(100, 1, 0.7)),
  group = gl(2,100)
  )

Để thực hiện kiểm tra thứ hạng nhật ký tiêu chuẩn, người ta có thể sử dụng

survdiff(Surv(time, status) ~ group, data = obs, rho = 0)

đúng?

Nhưng những gì về bài kiểm tra khác? Làm thế nào bạn có thể thực hiện một bài kiểm tra xếp hạng Wilcoxon có chữ ký, bài kiểm tra Peto hoặc bài kiểm tra Fleming-Harrington?

R cung cấp khả năng thực hiện xét nghiệm Wilcoxon , tuy nhiên tôi không tìm thấy cách để kiểm duyệt.

Hơn nữa, tài liệu nói rằng cài đặt rho = 1sẽ làm cho thử nghiệm trở thành "sửa đổi Peto & Peto của thử nghiệm Gehan-Wilcoxon". Nhưng điều này có giống như thử nghiệm Peto không?


Tôi không biết dữ liệu sinh tồn của mình, nhưng dường như google: Wilcox Test Và việc đọc tài liệu để survdiffcài đặt rho=1khiến nó trở thành thử nghiệm Peto ...
Justin

Vâng, cảm ơn! điều này là xa như tôi đã nhận được. Tuy nhiên, tôi đã không tìm ra cách để wilcox.testkiểm duyệt. Với rho=1tôi không chắc đây là xét nghiệm Peto hay xét nghiệm Wilcoxon, vì tài liệu nêu rõ "Peto & Peto sửa đổi thử nghiệm Gehan-Wilcoxon". Không cần downvote.
Marcel

Câu trả lời:


7

(Bạn có lẽ nên trích dẫn nguồn cho các quy ước đặt tên của mình và giải thích chi tiết hơn tại sao câu hỏi này được đặt ra. Nếu đây là trường hợp cố gắng khớp tài liệu cho SAS hoặc SPSS, chúng tôi có thể gặp khó khăn về văn hóa.)

Câu trả lời nhanh cho câu hỏi cụ thể của bạn về cách nhận "bài kiểm tra Peto" là sử dụng rho = 1, nhưng nó sẽ là một xấp xỉ. Đề cập đến các phần một mẫu và hai mẫu của chương 7 trong "Phân tích sinh tồn" của Klein và Moeschberger, chúng tôi đọc rằng phiên bản Peto-Peto và phiên bản Gehan đều là phiên bản hai mẫu (bị kiểm duyệt) của Mann-Whitney Wilcoxon thử nghiệm hai mẫu nhưng sử dụng các phiên bản khác nhau của công cụ ước tính chức năng sống sót. Không có "thử nghiệm Fleming-Harrington" duy nhất vì thuật ngữ đó đề cập đến một nhóm các thử nghiệm làm giảm thứ hạng log và các thử nghiệm loại Wilcoxon ở các giá trị được chỉ định rho. (Hàm R / S surv.diffcó tham số q của họ Fleming-Harrington được cố định ở 0 và chỉ thay đổi tham số p mà nó đặt tên là rho.)

Một câu hỏi meta là liệu bạn có nên tập trung vào tên và không tập trung vào chất toán học? Chọn p = rho = 0 (với q cố định ở 0) trong gia đình Fleming-Harrington có trọng số (OE) hoặc chênh lệch nhóm ngang nhau trong khoảng thời gian, trong khi cả Gehan-Wilcoxon và Peto-Peto đều kiểm tra trọng số sớm Tử vong mạnh hơn. Ý kiến ​​của tôi (với tư cách là một bác sĩ) là rất hợp lý khi cân nhắc những khác biệt sớm có thể xảy ra hơn đối với trường hợp điển hình, nhưng có thể tưởng tượng những trường hợp cụ thể trong đó lựa chọn khác có thể được bảo vệ.


Cảm ơn bạn đã giải thích của bạn. Các quy ước đặt tên của tôi đến từ "Kleinbaum & Klein - Phân tích sinh tồn" (trang 63ff). Họ định nghĩa w (t_j) = 1 cho Xếp hạng nhật ký, w (t_j) = n_j cho Wilcoxon, w (t_j) = n ^ (1/2) cho Tarone-Ware, w (t_j) = s (t_j) cho Peto, và một biểu hiện khá khó khăn cho Flemington-Harrington. Tôi không biết mình sẽ cần những trọng lượng nào trong tương lai nhưng tôi muốn chắc chắn rằng tôi có thể áp dụng chúng trước khi tôi cần :) Nhưng tôi nghĩ câu trả lời của bạn sẽ giúp tôi giải quyết vấn đề này. Cảm ơn bạn!
Marcel

5

Để trả lời câu hỏi của bạn về cách tính toán này trong R, bạn có thể sử dụng comp()hàm từ survMiscgói. Thí dụ:

> library(survMisc)
> fit = survfit(Surv(time, status) ~ x, data = aml)
> comp(fit)$tests$lrTests
                              ChiSq df      p
Log-rank                       3.40  1 0.0653
Gehan-Breslow (mod~ Wilcoxon)  2.72  1 0.0989
Tarone-Ware                    2.98  1 0.0842
Peto-Peto                      2.71  1 0.0998
Mod~ Peto-Peto (Andersen)      2.64  1 0.1042
Flem~-Harr~ with p=1, q=1      1.45  1 0.2281

Để chọn các tham số cho thử nghiệm Fleming-Harrington (được hiển thị trong dòng cuối cùng), bạn sử dụng các đối số FHpFHq. Ví dụ,

> comp(fit, FHp=0, FHq=0)$tests$lrTests
[…]
Flem~-Harr~ with p=0, q=0      3.40  1 0.0653

cung cấp cho bạn bài kiểm tra thứ hạng log thông thường (cũng được hiển thị trong dòng đầu tiên trong ví dụ đầu tiên).


1
Trong phiên bản SurvMisc hiện tại (0.5.4), nó phải làcomp(ten(fit))
Marcin Kosiński
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.