Tôi sẽ không sử dụng điểm giữa cho bất kỳ khoảng thời gian nào (có lẽ là dự đoán ban đầu cho một số quy trình lặp).
Nếu dữ liệu thực sự từ một phân phối theo cấp số nhân, các giá trị trong mỗi thùng sẽ bị lệch phải; giá trị trung bình sẽ được dự kiến là trái trung bình của ranh giới bin.
Lưu ý rằng phương trình λ^= =1X¯là phù hợp nếu bạn có tất cả các dữ liệu. Với dữ liệu đã được đánh dấu, bạn cần tối đa hóa khả năng theo cấp số nhân (tức là kiểm duyệt giữa chừng).
[Đóng góp cho khả năng đăng nhập của nTôi quan sát trong thùng Tôi - những người ở giữa tôiTôi và bạnTôi -- Là nTôiđăng nhập( F(tôiTôi) - F(bạnTôi) ) (trong đó hai thuật ngữ trong F là các hàm của (các) tham số của phân phối).]
Do thiếu thuộc tính bộ nhớ của số mũ, nếu bạn có xấp xỉ tốt với giá trị trung bình của số mũ, bạn cũng có một xấp xỉ tốt về số tiền mà giá trị trung bình của phân phối trên một số giá trị x0 vượt quá x0.
Vì vậy (giả sử bạn không trực tiếp tối đa hóa khả năng * trên khoảng thời gian kiểm duyệt dữ liệu như tôi đã đề xuất), bạn có thể bắt đầu với một số ước tính gần đúng về giá trị trung bình (m( 0 ) nói) và sử dụng 120 +m( 0 ) như một "trung tâm" của đuôi trên.
Điều này sau đó có thể được sử dụng để có được ước tính tốt hơn về tham số (và do đó là giá trị trung bình) và do đó có được ước tính cải thiện về giá trị trung bình có điều kiện trong mỗi thùng bao gồm cả thông số trên cùng. [Nếu bạn muốn một cách tiếp cận như vậy, có lẽ tôi sẽ nghiêng về làm EM trực tiếp.]
Một số ước tính đơn giản về giá trị trung bình có thể được lấy một cách nhanh chóng. Ví dụ: vì 41% giá trị xảy ra dưới 20,điểm kinh nghiệm( -20λ^( 0 )) = 1 - 0,41 tương ứng với ước tính trung bình gần với 38. Ngoài ra, người ta có thể có được ước tính nhãn cầu nhanh về trung vị (khoảng dưới 30, có lẽ khoảng 28), vì vậy giá trị trung bình phải ở đâu đó gần28 / nhật ký( 2 )hoặc xung quanh 40.
Một trong hai điều này sẽ hợp lý để sử dụng như một dự đoán ban đầu ở khoảng cách trên 120 để đặt ước tính cho giá trị trung bình có điều kiện cho thùng cuối cùng.
* Một cách khác để tối đa hóa khả năng sẽ là giảm thiểu thống kê chi bình phương; điều chỉnh tương tự cho df sẽ được sử dụng trong trường hợp đó. Thống kê chi bình phương tương đối dễ tính và khá đơn giản để tối ưu hóa cho một tham số duy nhất: