Tôi có một thí nghiệm sẽ tạo ra các quan sát về thời gian cho đến khi một sự kiện xảy ra. Một số tính chất cơ bản là
- Chúng tôi đếm số lượng sự kiện đã xảy ra tại một số điểm .
- Thời gian sự kiện là khoảng thời gian được kiểm duyệt, giữa ,
- Các cá nhân sẽ không rời khỏi thử nghiệm giữa , đó là một cá nhân trải nghiệm sự kiện trước hoặc không, tại thời điểm đó họ bị kiểm duyệt,
- Một tỷ lệ lớn các cá nhân sẽ không nhận được sự kiện bằng , khi chúng tôi chấm dứt thử nghiệm và
- Tôi không thể giả sử bất kỳ mô hình phân rã tham số cơ bản.
Nó dường như là một ứng dụng tự nhiên để phân tích sinh tồn. Tuy nhiên, thật phức tạp bởi thực tế là việc lặp lại thử nghiệm từ cùng một cấu hình ban đầu nhiều lần. Trong thực tế, chúng ta sẽ có một tập hợp các sự kiện (trong đó là số lượng mẫu) cho mỗi thời gian quan sát . Tôi còn khá mới đối với thống kê và tôi đang cố gắng xem cách áp dụng phân tích sinh tồn cho dữ liệu này (nếu nó thậm chí có thể áp dụng và không có phương pháp nào phù hợp hơn để đo loại dữ liệu theo thời gian này). Xu hướng của tôi là xây dựng hàm tồn tại xung quanh số lượng trung bình của các sự kiện được quan sát tại mỗi khoảng thời gian (ví dụ:), nên ước tính tốt hơn số lượng sự kiện dự kiến ở mỗi khoảng thời gian trong dân số, tuy nhiên tôi không biết liệu điều này có phù hợp hay không có ý nghĩa gì.
Tôi đã tìm kiếm vô ích trên Google Scholar, nếu có ai có thể chỉ cho tôi nhiều tài liệu hơn (hoặc đưa cho tôi danh pháp chính xác cho những gì tôi đang cố gắng làm), nó sẽ được đánh giá cao.
Biên tập
Cho rằng các khoảng là đồng nhất trên tất cả các mẫu, giả sử rằng tôi có ma trận sau mô tả số lượng cá thể tích lũy mà một sự kiện đã xảy ra trong mỗi khoảng
trong đó mỗi hàng đưa ra số đếm sự kiện cho cùng một nhóm các cá nhân có nguy cơ tại trên tất cả các mẫu (tức là nhiều trường hợp của thử nghiệm) và mỗi cột là một khoảng quan sát. Tôi giả sử rằng bằng cách lấy số lượng sự kiện trung bình cho mỗi khoảng thời gian, tôi có thể ước tính tốt hơn về tỷ lệ sống của dân số dự kiến, vì vậy hãy biểu thị số lượng khoảng thời gian, biểu thị số lượng mẫu (ví dụ thí nghiệm), sau đó là vectơn s
sẽ là số trung bình của các sự kiện được quan sát cho mỗi khoảng thời gian.
Sau đó, mục tiêu của tôi là sử dụng điều này làm đầu vào cho ước tính tỷ lệ sống. Gọi là số lượng cá thể có nguy cơ khi . Sử dụng công cụ ước tính ngây thơ (hiện tại, cho rằng các khoảng thời gian sự kiện là thống nhất trên tất cả các mẫu và không có kiểm duyệt cho đến ), chức năng sống sót có thể được ước tính là:t = 0 t n
Điều này (hy vọng) sẽ là một ước tính tốt hơn về tỷ lệ sống của dân số so với bất kỳ mẫu riêng lẻ nào (một hàng từ ). Để cải cách câu hỏi của tôi:
- Là một đầu vào phù hợp với một ước lượng chức năng sống sót? Tôi chưa thấy cách tiếp cận này trong bất kỳ tài liệu nào tôi đã đọc.
- Như tôi thực sự, một người mới làm thống kê, có thể chỉ cho tôi một số tài liệu (tài liệu học thuật, sách giáo khoa, wiki, v.v.) sẽ ổn khi ước tính khoảng tin cậy và phương sai cho ước tính chức năng sống sót này? Tôi đoán nó sẽ không giống với công thức tiêu chuẩn.
Xin lỗi nếu câu hỏi ban đầu của tôi khó hiểu, có lẽ tôi đã không bao gồm đủ thông tin.