“Là gì 2 giá trị” được đưa ra trong bản tóm tắt của một mô hình coxph trong R


18

Là gì giá trị được đưa ra trong bản tóm tắt của một mô hình coxph vào R? Ví dụ,R2

Rsquare= 0.186   (max possible= 0.991 )

Tôi dại dột đưa nó vào một bản thảo như một giá trị và người đánh giá đã nhảy vào nó nói rằng anh ta không biết về sự tương tự của thống kê từ hồi quy tuyến tính cổ điển đang được phát triển cho mô hình Cox và nếu có thì xin vui lòng cung cấp một tài liệu tham khảo. Bất kỳ sự trợ giúp nào đều sẽ là tuyệt vời!R2R2


1
Trong hầu hết các tình huống trong đó khái niệm được mở rộng ra ngoài hồi quy tuyến tính cổ điển, đó là mối tương quan bình phương giữa các giá trị quan sát và các giá trị được dự đoán theo mô hình. Điều đó có thể được áp dụng ở đây? R2
Macro

2
Không, nó không liên quan đến điều đó.
Frank Harrell

Câu trả lời:


15

Sử dụng getS3method("summary","coxph")bạn có thể nhìn vào cách nó được tính toán.

Các dòng mã có liên quan như sau:

logtest <- -2 * (cox$loglik[1] - cox$loglik[2])
rval$rsq <- c(rsq = 1 - exp(-logtest/cox$n), maxrsq = 1 - 
        exp(2 * cox$loglik[1]/cox$n))

Đây cox$logliklà "một vectơ có độ dài 2 chứa khả năng ghi nhật ký với các giá trị ban đầu và với các giá trị cuối cùng của các hệ số" (xem ?coxph.object) và cox$nlà "số lượng quan sát được sử dụng trong sự phù hợp".


5
Nếu tôi không nhầm, đó là giả R-bình phương Cox & Snell. Để được giải thích và so sánh các R-squared giả khác nhau, xem ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htmlm .
vào

4

Chia cho số lượng quan sát trong bản tóm tắt là sai, nó phải là số lượng các sự kiện không được kiểm duyệt; xem O'Quigley et al. (2005) Giải thích tính ngẫu nhiên trong các mô hình mối nguy theo tỷ lệ Thống kê trong Y học p. 479-361.ncoxph


4
Không chính xác, bạn chia cho số lượng quan sát, cho dù âm thanh đó lạ như thế nào. Đối với câu hỏi ban đầu, thật kỳ lạ khi một nhà phê bình sẽ không nhận thức được điều gì đó đã tồn tại trong 20 năm cho mô hình Cox.
Frank Harrell

Thêm vào việc trao đổi giữa Ronghui Xu và @Frank Harrell, không chỉ nó 'nghe có vẻ lạ' 'chia cho số lượng quan sát, nó không hoạt động. Để thấy điều này, hãy xem xét beta cố định ở một số giá trị sao cho, đại khái, E (R2) = 0,5 và phân phối đồng biến giống nhau, nghĩa là mọi thứ đều giống nhau, ngoài thực tế là Nghiên cứu 1 có tỷ lệ kiểm duyệt gấp đôi so với Nghiên cứu 2 Mặc dù chúng ta nên ước tính cùng một lượng dân số, nhưng ước tính R2 trong Nghiên cứu 1 sẽ bằng khoảng một nửa so với Nghiên cứu 2, bất kể cỡ mẫu. Thay vì 0,5, chúng tôi sẽ nhận được khoảng 0,25.

R2

Trả lời nhận xét của Frank, tôi đồng ý rằng điều này không đơn giản và quan sát của Frank liên quan đến khả năng đăng nhập null là chính xác. Tôi chỉ từng xem đại lượng này là một xấp xỉ với một ước lượng nhất quán của một lượng dân số được xác định rõ dựa trên mức tăng thông tin. Bài báo được đề cập bởi Ronghui Xu thực hiện mô phỏng. Những điều này cho thấy tác động của kiểm duyệt, mặc dù không vắng mặt, sẽ yếu hơn nhiều khi chúng ta chia cho số lần thất bại thay vì tổng số quan sát.

1
R2
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.