Một điều cần lưu ý với đường cong sinh tồn Kaplan-Meier là về cơ bản nó là mô tả và không suy diễn . Nó chỉ là một chức năng của dữ liệu, với một mô hình cực kỳ linh hoạt nằm đằng sau nó. Đây là một điểm mạnh bởi vì điều này có nghĩa là hầu như không có giả định nào có thể bị phá vỡ, mà là một điểm yếu bởi vì rất khó để khái quát hóa nó, và nó phù hợp với "tiếng ồn" cũng như "tín hiệu". Nếu bạn muốn đưa ra một suy luận, thì về cơ bản bạn phải giới thiệu một cái gì đó chưa biết mà bạn muốn biết.
Bây giờ một cách để so sánh thời gian sống sót trung bình là đưa ra các giả định sau:
- Tôi có một ước tính về thời gian tồn tại trung bình cho mỗi trạng thái , được đưa ra bởi đường cong meap kaplan. itii
- Tôi hy vọng thời gian tồn tại trung bình thực sự, sẽ bằng với ước tính này. E ( T i | t i ) = t iTTôiE( TTôi| tTôi) = tTôi
- Tôi chắc chắn 100% rằng thời gian sống sót trung bình thực sự là tích cực. Pr ( TTôi> 0 ) = 1
Bây giờ cách "bảo thủ nhất" để sử dụng các giả định này là nguyên tắc entropy tối đa, vì vậy bạn nhận được:
p ( TTôi| tTôi) = Ke x p ( - λ TTôi)
Trong đó và được chọn sao cho PDF được chuẩn hóa và giá trị mong đợi là . Bây giờ chúng tôi có:λ t iKλtTôi
= K [ - e x p ( - λ T i )
1 = ∫∞0p ( TTôi| tTôi) dTTôi= K∫∞0e x p ( - λ TTôi) dTTôi
E ( T i ) = 1= K[ - e x p ( - λ TTôi)λ]TTôi= ∞TTôi= 0= Kλ⟹K= λ
và bây giờ chúng ta có
E(Ti)=1λ⟹λ=t−1i
Và do đó, bạn có một bộ phân phối xác suất cho mỗi trạng thái.
p(Ti|ti)=1tiexp(−Titi)(i=1,…,N)
Cung cấp phân phối xác suất chung của:
p(T1,T2,…,TN|t1,t2,…,tN)=∏i=1N1tiexp(−Titi)
Bây giờ có vẻ như bạn muốn kiểm tra giả thuyết , trong đó là thời gian sống sót trung bình trung bình. Giả thuyết thay thế nghiêm trọng để kiểm tra lại là giả thuyết "mỗi trạng thái là một bông tuyết độc đáo và đẹp" bởi vì đây là sự thay thế rất có thể, và do đó đại diện cho thông tin bị mất khi chuyển sang giả thuyết đơn giản hơn (một thử nghiệm "minimax"). Thước đo của bằng chứng chống lại giả thuyết đơn giản hơn được đưa ra bởi tỷ lệ chênh lệch:¯ t = 1H0:T1=T2=⋯=TN=t¯HMột:T1=t1,...,TN=tNt¯=1N∑Ni=1tiHA:T1=t1,…,TN=tN
= [ Π N i = 1 1
O(HA|H0)=p(T1=t1,T2=t2,…,TN=tN|t1,t2,…,tN)p(T1=t¯,T2=t¯,…,TN=t¯|t1,t2,…,tN)
=[∏Ni=11ti]exp(−∑Ni=1titi)[∏Ni=11ti]exp(−∑Ni=1t¯ti)=exp(N[t¯tharm−1])
Ở đâu
tharm=[1N∑i=1Nt−1i]−1≤t¯
là trung bình điều hòa. Lưu ý rằng tỷ lệ cược sẽ luôn ưu tiên sự phù hợp hoàn hảo, nhưng không nhiều nếu thời gian sống sót trung bình gần hợp lý. Hơn nữa, điều này cung cấp cho bạn một cách trực tiếp để nêu bằng chứng của thử nghiệm giả thuyết cụ thể này:
các giả định 1-3 đưa ra tỷ lệ cược tối đa là so với thời gian tồn tại trung bình bằng nhau trên tất cả các trạng tháiO(HA|H0):1
Kết hợp điều này với quy tắc quyết định, chức năng mất, chức năng tiện ích, v.v ... cho biết mức độ thuận lợi của việc chấp nhận giả thuyết đơn giản hơn và bạn đã có kết luận của mình!
Không có giới hạn về số lượng giả thuyết bạn có thể kiểm tra và đưa ra tỷ lệ cược tương tự cho. Chỉ cần thay đổi để chỉ định một bộ "giá trị thực" khác có thể. Bạn có thể thực hiện "kiểm tra ý nghĩa" bằng cách chọn giả thuyết là:H0
HS,i:Ti=ti,Tj=T=t¯(i)=1N−1∑j≠itj
Vì vậy, giả thuyết này là bằng lời nói "trạng thái có tỷ lệ sống trung bình khác nhau, nhưng tất cả các trạng thái khác đều giống nhau". Và sau đó làm lại phép tính tỷ lệ cược tôi đã làm ở trên. Mặc dù bạn nên cẩn thận về giả thuyết thay thế là gì. Đối với bất kỳ một trong những điều dưới đây là "hợp lý" theo nghĩa chúng có thể là những câu hỏi mà bạn quan tâm để trả lời (và chúng thường sẽ có câu trả lời khác nhau)i
- của tôi được xác định ở trên - tệ hơn bao nhiêu so với mức phù hợp hoàn hảo?HAHS,i
- của tôi được xác định ở trên - tốt hơn bao nhiêu so với mức phù hợp trung bình?H0HS,i
- a - trạng thái "khác nhau" hơn bao nhiêu so với trạng thái ?HS,kki
Bây giờ một điều đã được xem xét quá mức ở đây là mối tương quan giữa các trạng thái - cấu trúc này giả định rằng việc biết tỷ lệ sống trung bình ở một trạng thái không cho bạn biết gì về tỷ lệ sống trung bình ở trạng thái khác. Mặc dù điều này có vẻ "xấu" nhưng không khó để cải thiện và các tính toán trên là kết quả ban đầu tốt, dễ tính toán.
Thêm kết nối giữa các trạng thái sẽ thay đổi các mô hình xác suất và bạn sẽ thấy một số "thời gian" tồn tại trung bình một cách hiệu quả. Một cách để kết hợp các mối tương quan vào phân tích là tách thời gian tồn tại thực sự thành hai thành phần, "phần chung" hoặc "xu hướng" và "phần riêng lẻ":
Ti=T+Ui
Và sau đó hạn chế phần cá nhân để có zero trung bình trên tất cả các đơn vị và phương sai chưa biết được tích hợp bằng cách sử dụng một mô tả kiến thức gì trước khi bạn có các sự thay đổi cá nhân, trước khi quan sát các dữ liệu (hoặc Jeffreys trước nếu bạn không biết gì, và nửa tỉnh táo nếu jeffreys gây ra vấn đề).Uiσ