Kiểm duyệt khoảng


8

Tôi đã chạy một đường cong sinh tồn kiểm duyệt với R, JMP và SAS. Cả hai đều cho tôi các biểu đồ giống hệt nhau, nhưng các bảng khác nhau một chút. Đây là bảng JMP đưa cho tôi.

Start Time  End Time    Survival    Failure SurvStdErr
.            14.0000      1.0000     0.0000     0.0000
16.0000      21.0000      0.5000     0.5000     0.2485
28.0000      36.0000      0.5000     0.5000     0.2188
40.0000      59.0000      0.2000     0.8000     0.2828
59.0000      91.0000      0.2000     0.8000     0.1340
94.0000     .             0.0000     1.0000     0.0000

Đây là cái bàn mà SAS đưa cho tôi:

Obs Lower Upper Probability Cum Probability Survival Prob Std.Error
1    14    16      0.5          0.5             0.5        0.1581
2    21    28      0.0          0.5             0.5        0.1581
3    36    40      0.3          0.8             0.2        0.1265
4    91    94      0.2          1.0             0.0        0.0

R có đầu ra nhỏ hơn. Biểu đồ giống hệt nhau và đầu ra là:

Interval (14,16] -> probability 0.5
Interval (36,40] -> probability 0.3
Interval (91,94] -> probability 0.2

Vấn đề của tôi là:

  1. Tôi không hiểu sự khác biệt
  2. Tôi không biết làm thế nào để giải thích kết quả ...
  3. Tôi không hiểu logic đằng sau phương pháp.

Nếu bạn có thể giúp tôi, đặc biệt là với việc giải thích, nó sẽ là một trợ giúp tuyệt vời. Tôi cần tóm tắt kết quả trong một vài dòng và không chắc cách đọc các bảng.

Tôi nên thêm rằng mẫu chỉ có 10 quan sát, không may, trong các khoảng thời gian xảy ra sự kiện. Tôi không muốn sử dụng phương pháp cắt bỏ điểm giữa bị sai lệch. Nhưng tôi có hai khoảng (2,16] và người đầu tiên không sống sót bị thất bại ở tuổi 14 trong phân tích, vì vậy tôi không biết nó làm như thế nào.

Biểu đồ:

nhập mô tả hình ảnh ở đây


1
Trên thực tế, RSAShoàn toàn đồng ý với nhau: SASbao gồm 4 khoảng thay vì 3, nhưng lưu ý rằng CDF không thay đổi trong khoảng 2! Trong thực tế, JMPkết quả cũng đồng ý, nhưng khó theo dõi hơn một chút.
Vách đá AB

Câu trả lời:


1

Vấn đề quan trọng nhất ở đây là sự hiểu biết về kiểm duyệt và loại nào áp dụng trong tình huống của bạn. Vì vậy, đối với các vấn đề của bạn 1. và 3., hãy hiểu bối cảnh của vấn đề của bạn. Điều này sẽ giúp bạn xác định phương pháp kiểm duyệt thích hợp.

Đầu ra R nói rằng nhóm thất bại đầu tiên nằm trong khoảng (14,16]. Điều này không có nghĩa là thất bại xảy ra ở 14. Điều đó có nghĩa là R giả định dữ liệu được kiểm duyệt đúng, đây là giả định phổ biến nhất để phân tích tỷ lệ sống. Tại sao sự thất bại được trích dẫn là một phạm vi (14,16] trái ngược với chỉ một xác suất ở mức 16? Có thể là do ước tính giới hạn độ tin cậy.

Giải thích kết quả R, tương tự như SAS: Xác suất thất bại tại t = 16 là 50%, tại t = 40 là 30%, tại t = 94 là 20%.

Hãy quên việc cố gắng hiểu vấn đề bằng cách sử dụng ba gói phân tích. Chọn một, hiểu các tùy chọn bạn có thể đặt để kiểm duyệt và sử dụng nó. Một liên kết tốt cho R: ở đây


Bối cảnh của câu hỏi là sự tái phát của một điều kiện. Tôi quan tâm đến thời điểm tái phát. Thật không may, các chuyến thăm tiếp theo không phải là hàng ngày, và vì vậy, nếu ở lần truy cập số 4, sự tái phát xảy ra, tôi không biết giữa 3 (+ một ngày) và 4 xảy ra ở đâu. Việc kiểm duyệt là kiểm duyệt đúng, và trong số 10 quan sát chỉ có 1 quan sát được kiểm duyệt là (94, vô cùng). Sẽ đúng khi nói rằng 50% sống sót sau hơn 28 ngày?
dùng45442

và một câu hỏi nữa, vì kiểm duyệt khoảng thời gian dựa trên dữ liệu chưa biết, việc ước tính dựa trên 10 quan sát có hiệu quả như thế nào? Các ước tính có thực sự tốt hơn so với các ước tính mà tôi sẽ nhận được theo cách sai lệch của điểm giữa, trong đó tôi lấy giá trị trung bình của mỗi khoảng để biểu diễn khoảng?
dùng45442

1
Tôi sẽ không nói 50% sống sót sau 28 ngày hoặc hơn, vì bạn không biết rằng vì lý do không chắc chắn trong khoảng thời gian bạn chỉ ra. Bạn có thể nói rằng 50% sống sót đến Ngày 16. Liên quan đến vấn đề khoảng cách, bạn đưa ra một vấn đề rất thực tế có liên quan đến việc thiếu dữ liệu. Sử dụng một phương pháp cắt bỏ điểm giữa có ý nghĩa, nhưng cách tiếp cận được chấp nhận rộng rãi cho tình huống của bạn là ước lượng Kaplan Meier .
Gary Chung

3
@GaryChung: bạn hoàn toàn bỏ qua khía cạnh kiểm duyệt khoảng thời gian của dữ liệu này.
Cliff AB
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.