Một mẫu dân số ngẫu nhiên đã được khảo sát. Họ được hỏi nếu họ ăn chay. Nếu họ trả lời có, họ cũng được yêu cầu xác định thời gian họ ăn chay mà không bị gián đoạn. Tôi muốn sử dụng dữ liệu này để tính thời gian tuân thủ ăn chay trung bình. Nói cách khác, khi ai đó ăn chay, tôi muốn biết trung bình họ ăn chay lâu. Hãy giả sử rằng:
- Tất cả những người được hỏi đã trả lời đúng và chính xác
- Thế giới ổn định: sự phổ biến của việc ăn chay không thay đổi, thời gian tuân thủ trung bình cũng không thay đổi.
Lý luận của tôi cho đến nay
Tôi thấy thật hữu ích khi phân tích một mô hình đồ chơi của thế giới, nơi vào đầu mỗi năm hai người trở thành người ăn chay. Mỗi lần, một trong số họ ăn chay trong 1 năm và một người khác trong 3 năm. Rõ ràng, thời gian tuân thủ trung bình trong thế giới này là (1 + 3) / 2 = 2 năm. Dưới đây là một biểu đồ minh họa ví dụ. Mỗi hình chữ nhật đại diện cho một thời kỳ ăn chay:
Giả sử chúng ta thực hiện một cuộc khảo sát vào giữa năm 4 (đường màu đỏ). Chúng tôi nhận được các dữ liệu sau:
Chúng tôi sẽ nhận được cùng một dữ liệu nếu chúng tôi thực hiện khảo sát vào bất kỳ năm nào, bắt đầu từ năm 3. Nếu chúng tôi chỉ lấy trung bình các câu trả lời chúng tôi nhận được:
(2 * 0,5 + 1,5 + 2,5) / 4 = 1,25
Chúng tôi đánh giá thấp bởi vì chúng tôi cho rằng tất cả mọi người đã ngừng ăn chay ngay sau khi khảo sát, điều này rõ ràng là không chính xác. Để có được ước tính gần với thời gian trung bình thực mà những người tham gia này vẫn ăn chay, chúng ta có thể giả sử rằng trung bình, họ đã báo cáo khoảng thời gian giữa chừng thời gian ăn chay của họ và nhân lên thời lượng báo cáo gấp đôi. từ dân số (như người tôi đang phân tích), tôi nghĩ đây là một giả định thực tế. Ít nhất là nó sẽ cho một giá trị mong đợi chính xác. Tuy nhiên, nếu nhân đôi là điều duy nhất chúng ta làm, chúng ta nhận được trung bình 2,5, đó là một sự đánh giá quá cao. Điều này là do người ăn chay càng lâu, anh ta càng có nhiều khả năng trong mẫu người ăn chay hiện tại.
Sau đó tôi nghĩ rằng xác suất có người trong mẫu người ăn chay hiện tại tỷ lệ thuận với thời gian ăn chay của họ. Để giải thích cho sự thiên vị này, tôi đã cố gắng phân chia số lượng người ăn chay hiện tại theo thời gian tuân thủ dự đoán của họ:
Tuy nhiên, điều này cũng cho một mức trung bình không chính xác:
(2 * 1 + * 3 + ⅕ * 5) / (2 + +) = 4 / 2.533333 = 1.579 năm
Nó sẽ đưa ra ước tính chính xác nếu số lượng người ăn chay được chia cho thời gian tuân thủ chính xác của họ:
(1 + * (1 + 3 + 5)) / (1 + ⅓ * 3) = 2 năm
Nhưng nó không hoạt động nếu tôi sử dụng thời gian tuân thủ dự đoán và chúng là tất cả những gì tôi có trong thực tế. Tôi không biết những gì khác để thử. Tôi đã đọc một chút về phân tích sinh tồn nhưng tôi không chắc làm thế nào để áp dụng nó trong trường hợp này. Lý tưởng nhất, tôi cũng muốn có thể tính toán khoảng tin cậy 90%. Bất kỳ lời khuyên sẽ được đánh giá rất cao.
EDIT: Có thể là câu hỏi trên không có câu trả lời. Nhưng cũng có một nghiên cứu khác hỏi một mẫu người ngẫu nhiên rằng họ có / đang ăn chay không và họ đã ăn chay bao nhiêu lần trong quá khứ. Tôi cũng biết tuổi của mọi người trong cả nghiên cứu và một số thứ khác. Có lẽ thông tin này có thể được sử dụng kết hợp với khảo sát những người ăn chay hiện tại để có được ý nghĩa nào đó. Trong thực tế, nghiên cứu mà tôi nói đến chỉ là một phần của câu đố, nhưng là một phần rất quan trọng và tôi muốn nhận được nhiều hơn từ nó.