Ước tính ML của phân phối theo cấp số nhân (với dữ liệu bị kiểm duyệt)


9

Trong Phân tích sinh tồn, bạn giả sử thời gian tồn tại của rv được phân phối theo cấp số nhân. Bây giờ tôi đang xem "kết quả" của của iid rv . Chỉ một số tỷ lệ của các kết quả này trong thực tế là "hoàn toàn nhận ra", tức là các quan sát còn lại vẫn còn "sống".Xix1,,xnXi

Nếu tôi muốn thực hiện ước tính ML cho tham số tỷ lệ của phân phối, làm thế nào tôi có thể sử dụng các quan sát không nhận ra theo cách mạch lạc / phù hợp? Tôi tin rằng chúng vẫn chứa thông tin hữu ích cho việc ước tính.λ

Ai đó có thể hướng dẫn tôi đến văn học về chủ đề này? Tôi chắc chắn rằng nó tồn tại. Tuy nhiên tôi gặp khó khăn khi tìm từ khóa / cụm từ tìm kiếm tốt cho chủ đề.


3
Vì vậy, bạn đang nói rằng từ biến ngẫu nhiên mà bạn có số đo, giả sử quan sát đại diện cho tuổi thọ "đã hoàn thành" (bởi vì, các biến ngẫu nhiên liên quan đã "chết" tại thời điểm đo), trong khi phần còn lại quan sát là độ dài tồn tại của các biến ngẫu nhiên "vẫn còn sống" tại thời điểm đo? ( )nn1<nn2<nn1+n2=n
Alecos Papadopoulos

1
đây là một mô hình bị cắt cụt, các biến ngẫu nhiên "còn sống" bị cắt ngắn tại thời điểm quan sát dừng lại.
Tây An

1
Kiểm tra các mô hình Tobit cho dữ liệu rút ngắn và các nguồn liên quan (ví dụ ở đây ).
Richard Hardy

2
Bạn dường như có dữ liệu bị kiểm duyệt, như thời gian sống, nơi một số người chết, nhưng một số người vẫn còn sống, như vậy bạn chỉ biết rằng, cho một số được biết đến . xi>titi
kjetil b halvorsen

3
Coi chừng sự khác biệt đôi khi tinh tế giữa hai tình huống. Không có gì lạ khi cắt xén bị nhầm lẫn để kiểm duyệt, và ngược lại.
Alecos Papadopoulos

Câu trả lời:


16

Bạn vẫn có thể ước tính các tham số bằng cách sử dụng khả năng trực tiếp. Đặt các quan sát là với phân bố mũ theo tỷ lệ và không xác định. Hàm mật độ là , hàm phân phối tích lũy và hàm đuôi . Giả sử các quan sát đầu tiên được quan sát đầy đủ, trong khi với chúng ta chỉ biết rằng đối với một số hằng số dương đã biếtx1,,xnλ>0f(x;λ)=λeλxF(x;λ)=1eλxG(x;λ)=1F(x;λ)=eλxrxr+1,,xnxj>tjtj. Như mọi khi, khả năng là "xác suất của dữ liệu được quan sát", đối với các quan sát bị kiểm duyệt, được đưa ra bởi , do đó, hàm khả năng đầy đủ là Hàm loglikabilities sau đó trở thành có dạng tương tự như loglikabilities cho trường hợp thông thường, được quan sát đầy đủ, ngoại trừ từ thuật ngữ đầu tiên trong nơi của . Viết cho ý nghĩa của thời gian quan sát và kiểm duyệt, ước tính khả năng tối đa của trở thànhP(Xj>tj)=G(tj;λ)

L(λ)=i=1rf(xi;λ)i=r+1nG(tj;λ)
l(λ)=rlogλλ(x1++xr+tr+1++tn)
rlogλnlogλTλλ^=rnT , mà chính bạn có thể so sánh với trường hợp được quan sát đầy đủ.
 EDIT   

Để cố gắng trả lời câu hỏi trong các bình luận: Nếu tất cả các quan sát đều bị kiểm duyệt, nghĩa là chúng tôi đã không chờ đợi đủ lâu để quan sát bất kỳ sự kiện nào (cái chết), chúng tôi có thể làm gì? Trong trường hợp đó, , do đó loglikabilities trở thành , đó là giảm tuyến tính trong . Vì vậy, tối đa phải là cho ! Nhưng, số 0 không phải là giá trị hợp lệ cho tham số tỷ lệ vì nó không tương ứng với bất kỳ phân phối theo cấp số nhân nào. Chúng ta phải kết luận rằng trong trường hợp này, công cụ ước tính khả năng tối đa không tồn tại! Có lẽ người ta có thể cố gắng xây dựng một số khoảng tin cậy chor=0

l(λ)=nTλ
λλ=0λλdựa vào chức năng loglikabilities đó? Đối với điều đó, nhìn bên dưới.

Nhưng, trong mọi trường hợp, kết luận thực sự từ dữ liệu trong trường hợp đó là chúng ta nên chờ thêm thời gian cho đến khi nhận được một số sự kiện ...

Dưới đây là cách chúng tôi có thể xây dựng khoảng tin cậy (một phía) cho trong trường hợp tất cả các quan sát đều bị kiểm duyệt. Hàm khả năng trong trường hợp đó là , có dạng tương tự như hàm khả năng từ một thí nghiệm nhị thức trong đó chúng ta có tất cả các thành công, đó là (xem thêm Khoảng tin cậy xung quanh ước tính nhị thức của 0 hoặc 1 ). Trong trường hợp đó, chúng tôi muốn khoảng tin cậy một phía cho có dạng . Sau đó chúng ta có được một khoảng thời gian cho bằng cách giải .λeλnTpnp[p¯,1]λlogp=λT

Chúng ta có được khoảng tin cậy cho bằng cách giải sao cho . Điều này cuối cùng đưa ra khoảng tin cậy cho : p

P(X=n)=pn0.95    (say)
nlogplog0.95λ
λlog0.95nT.

1
Đọc câu hỏi và trả lời tôi nghĩ "Sẽ thế nào nếu tất cả các quan sát thuộc loại thứ hai, mà chúng ta chỉ biết rằng , và không có quan sát nào được quan sát đầy đủ?" Sẽ rất hữu ích khi đưa trường hợp này vào câu trả lời của bạn, như một phần mở rộng. xj>tj
Alecos Papadopoulos
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.