Phân tích sinh tồn Bayesian: xin vui lòng, viết cho tôi trước cho Kaplan Meier!


20

Xem xét các quan sát được kiểm duyệt đúng, với các sự kiện tại các thời điểm t1,t2,Giáo dục . Số lượng cá thể nhạy cảm tại thời điểm tôintôi và số lượng sự kiện tại thời điểm tôidtôi .

Kaplan-Meier hoặc công cụ ước tính sản phẩm phát sinh tự nhiên dưới dạng MLE khi hàm tồn tại là hàm bước S(t)= =Πtôi:ttôi<tαtôi . Khả năng là

L(α)= =Πtôi(1-αtôi)dtôiαtôintôi-dtôi
và MLE là α^tôi= =1-dtôintôi .

OK, bây giờ giả sử rằng tôi muốn đi Bayesian. Tôi cần một số loại '`tự nhiên' 'trước đó tôi sẽ nhân L(α) , phải không?

Tìm kiếm các từ khóa rõ ràng tôi thấy rằng quy trình Dirichlet là một ưu tiên tốt. Nhưng theo tôi hiểu, đó cũng là một ưu tiên về điểm gián đoạn ?ttôi

Điều này chắc chắn rất thú vị và tôi rất muốn tìm hiểu về nó, tuy nhiên tôi sẽ giải quyết cho một cái gì đó đơn giản hơn. Tôi bắt đầu nghi ngờ điều đó không dễ như tôi nghĩ ban đầu, và đã đến lúc hỏi lời khuyên của bạn ...

Rất cám ơn trước!

Tái bút: Một vài độ chính xác về những gì tôi hy vọng tôi quan tâm (đơn giản nhất có thể) về cách xử lý quy trình Dirichlet trước đó, tuy nhiên tôi nghĩ rằng có thể sử dụng đơn giản trước một - đó là một ưu tiên trên các chức năng bước với sự không liên tục trong .t iαtôittôi

Tôi nghĩ rằng "hình dạng toàn cầu" của các hàm bước được lấy mẫu ở trước không nên phụ thuộc vào - nên có một nhóm các hàm liên tục nằm bên dưới được xấp xỉ bởi các hàm bước này.ttôi

Tôi không biết liệu có độc lập không (tôi nghi ngờ điều đó). Nếu đúng như vậy, tôi nghĩ điều này ngụ ý rằng trước phụ thuộc vào và nếu chúng tôi biểu thị phân phối của nó bởi thì sản phẩm của biến bởi biến độc lập là biến . Dường như ở đây các biến log- có thể hữu ích.αtôiαtôiΔttôi= =ttôi-ttôi-1Một(Δt)Một(Δ1)Một(Δ2)Một(Δ1+Δ2)Γ

Nhưng ở đây về cơ bản tôi đang bị mắc kẹt. Lúc đầu tôi không gõ cái này vì tôi không muốn hướng tất cả các câu trả lời theo hướng này. Tôi đặc biệt đánh giá cao câu trả lời với các tài liệu tham khảo thư mục để giúp tôi biện minh cho sự lựa chọn cuối cùng của mình.


Trong MLE, , gì? Đó có phải là một lỗi đánh máy? Ý bạn là ? một^tôi= =1-dtôimtôimtôintôi
stachyra

Vâng, đó là , tất nhiên. Tôi đúng. ntôi
Elvis

1
Từ trang trình bày này , tôi tìm thấy bài báo này , tác giả cũng có phần giới thiệu này . Nếu những thứ đó không đủ làm nguồn, tài liệu tham khảo của riêng họ có thể sẽ. Ngoài ra video này về các quá trình Dirichlet phân cấp.
Sean Easter

Lưu ý rằng tôi hiểu các đặc điểm cơ bản của DP nhưng tôi không hiểu rõ cách sử dụng nó một cách cụ thể như trước ... Ngoài ra, với biện pháp cơ bản nào, v.v.
Elvis

Là khả năng chức năng duy nhất? Hoặc bạn có thể nhận được KM từ các khả năng khác?
xác suất

Câu trả lời:


11

Lưu ý rằng vì hàm khả năng của bạn là sản phẩm của các hàm - dữ liệu đang cho bạn biết rằng không có bằng chứng nào cho mối tương quan giữa chúng. Lưu ý rằng các biến d i đã được chia tỷ lệ theo thời gian. Khoảng thời gian dài hơn có nghĩa là nhiều cơ hội hơn cho các sự kiện, thường có nghĩa là lớn hơn d i .αtôidtôidtôi

Cách cơ bản nhất để "đi Bayes" ở đây là sử dụng các linh mục đồng phục độc lập . Lưu ý rằng 0 < α i < 1 vì vậy đây là một ưu tiên thích hợp - do đó, hậu thế cũng phù hợp. Hậu là phân phối độc lập beta với các thông số p ( α i ) ~ b đ t một ( n i - d i + 1 , d i + 1 )p(αtôi)= =10<αtôi<1p(αtôi)~betmột(ntôi-dtôi+1,dtôi+1). Điều này có thể dễ dàng mô phỏng để tạo phân phối sau của đường cong sống sót, sử dụng rbeta ()hàm trong R chẳng hạn.

Tôi nghĩ rằng điều này nhận được ở câu hỏi chính của bạn về một phương pháp "đơn giản hơn". Dưới đây chỉ là sự khởi đầu của một ý tưởng để tạo ra một mô hình tốt hơn, giữ lại hình thức KM linh hoạt cho chức năng sinh tồn.

Tôi nghĩ rằng vấn đề chính với đường cong KM là ở chức năng Survival, và không phải ở trước. Ví dụ: tại sao các giá trị phải tương ứng với các điểm thời gian được quan sát? Sẽ không có ý nghĩa hơn khi đặt chúng tại các điểm tương ứng với thời gian sự kiện có ý nghĩa dựa trên quy trình thực tế? Nếu các điểm thời gian quan sát cách nhau quá xa, đường cong KM sẽ "quá trơn tru". Nếu chúng quá gần, đường cong KM sẽ "quá thô" và có khả năng thể hiện những thay đổi đột ngột. Một cách để đối phó với vấn đề này "quá thô" là đặt một trước tương quan trên αα iα i + 1ttôiααtôiαtôi+1. Tác dụng của việc này trước sẽ là thu nhỏ các tham số gần đó lại gần nhau hơn. Bạn có thể sử dụng điều này trong không gian "log-odds" và sử dụng bước đi ngẫu nhiên thứ k trướcη. Đối với một trật tự ngẫu nhiên đi bộ đầu tiên này giới thiệu hình phạt của mẫu-τ(ηi-ηi-1)2vào loga. Phần mềm BayesX có một số tài liệu rất tốt về loại làm mịn này. Về cơ bản việc chọn thứ tự k cũng giống như thực hiện một đa thức địa phương thứ k. Nếu bạn thích splines, chọn k = 3. Tất nhiên, bằng cách sử dụng lưới thời gian "tốt", bạn sẽ có các điểm thời gian mà không cần quan sát. Howdver, điều này làm phức tạp hàm likelihood của bạn, như cácni,diηtôi= =đăng nhập(αtôi1-αtôi)η-τ(ηtôi-ηtôi-1)2ntôi,dtôiđang thiếu cho một số . Ví dụ: nếu ( t 0 , t 1 ) được chia thành 3 khoảng "mịn hơn" ( t 00 , t 01 , t 02 , t 10 ) thì bạn không biết n 02 , n 10 , d 01 , d 02 , d 10 nhưng chỉ n 1 = n 01d 1 = d 01 + dtôi(t0,t1)(t00,t01,t02,t10)n02,n10,d01,d02,d10n1= =n01 . Vì vậy, bạn có thể sẽ cần phải thêm "dữ liệu bị thiếu" này và sử dụng thuật toán EM hoặc có lẽ VB (miễn là bạn không đi vào đường dẫn mcmc).d1= =d01+d02+d10

Hy vọng điều này cho bạn một khởi đầu.


αtôi

5

Đối với những độc giả đang đối mặt với vấn đề đi đến Bayesian để ước tính các chức năng sinh tồn chấp nhận kiểm duyệt đúng, tôi sẽ đề xuất phương pháp tiếp cận Bayes không định lượng được phát triển bởi F Mangili, A Benavoli et al. Thông số kỹ thuật duy nhất trước đó là tham số (độ chính xác hoặc cường độ). Nó tránh sự cần thiết phải xác định quy trình Dirichlet trong trường hợp thiếu thông tin trước. Các tác giả đề xuất (1) - một công cụ ước tính mạnh mẽ về các đường cong sống sót và các khoảng tin cậy của nó cho xác suất sống sót (2) - Một thử nghiệm về sự khác biệt sống sót của các cá nhân từ 2 quần thể độc lập mang lại nhiều lợi ích khác nhau trong thử nghiệm xếp hạng nhật ký cổ điển hoặc các xét nghiệm không theo dõi khác. Xem gói R IDPsurvival và tham chiếu này: Phân tích sinh tồn đáng tin cậy dựa trên quy trình Dirichlet. F Mangili et al. Tạp chí sinh trắc học. 2014.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.