Khi bạn đang xem xét các mô hình tham số đơn giản để phân phối dữ liệu có điều kiện (nghĩa là phân phối của từng nhóm hoặc phân phối dự kiến cho từng tổ hợp biến dự báo) và bạn đang xử lý phân phối liên tục tích cực , hai lựa chọn phổ biến là Gamma và log-Bình thường . Bên cạnh việc thỏa mãn đặc điểm kỹ thuật của miền phân phối (số thực lớn hơn 0), các phân phối này thuận tiện về mặt tính toán và thường có ý nghĩa cơ học.
- Các log-Normal phân phối có thể dễ dàng bắt nguồn bởi exponentiating một bản phân phối bình thường (ngược lại, log-chuyển lệch log-Normal cho lệch bình thường). Từ quan điểm cơ học, log-Bình thường phát sinh thông qua Định lý giới hạn trung tâm khi mỗi quan sát phản ánh sản phẩm của một số lượng lớn các biến ngẫu nhiên iid. Khi bạn đã chuyển đổi dữ liệu, bạn có quyền truy cập vào rất nhiều công cụ tính toán và phân tích (ví dụ: mọi thứ giả định Định mức hoặc sử dụng các phương pháp bình phương nhỏ nhất).
- Như câu hỏi của bạn chỉ ra, một cách mà phân phối Gamma phát sinh là phân phối thời gian chờ cho đến khi có sự kiện độc lập với thời gian chờ liên tục xảy ra. Tôi không thể dễ dàng tìm thấy một tài liệu tham khảo cho một mô hình cơ bản về phân phối Gamma của các yêu cầu bảo hiểm, nhưng cũng hợp lý khi sử dụng phân phối Gamma theo quan điểm hiện tượng (ví dụ, mô tả dữ liệu / tính thuận tiện tính toán). Phân phối Gamma là một phần của họ hàm mũ (bao gồm Bình thường nhưng không phải là log-Bình thường), có nghĩa là tất cả các máy móc của các mô hình tuyến tính tổng quátnλcó sẵn; nó cũng có một hình thức đặc biệt thuận tiện để phân tích.
Có những lý do khác người ta có thể chọn cái này hay cái kia - ví dụ, "độ nặng" của đuôi phân phối , có thể rất quan trọng trong việc dự đoán tần suất của các sự kiện cực đoan. Có rất nhiều phân phối tích cực, liên tục khác (ví dụ xem danh sách này ), nhưng chúng có xu hướng được sử dụng trong các ứng dụng chuyên biệt hơn.
Rất ít trong số các bản phân phối này sẽ nắm bắt được đa phương thức mà bạn thấy trong các bản phân phối cận biên ở trên, nhưng đa phương thức có thể được giải thích bằng dữ liệu được nhóm thành các loại được mô tả bởi các dự đoán phân loại được quan sát. Nếu không có các yếu tố dự đoán có thể quan sát được để giải thích tính đa phương thức, người ta có thể chọn điều chỉnh mô hình hỗn hợp hữu hạn dựa trên hỗn hợp của một số phân phối liên tục dương (nhỏ, rời rạc).