Tôi tự hỏi nếu ước tính khả năng tối đa từng được sử dụng trong thống kê.
Chắc chắn rồi! Thực tế khá nhiều - nhưng không phải lúc nào cũng vậy.
Chúng tôi tìm hiểu khái niệm về nó nhưng tôi tự hỏi khi nó thực sự được sử dụng.
Khi mọi người có một mô hình phân phối tham số, họ thường chọn sử dụng ước tính khả năng tối đa. Khi mô hình là chính xác, có một số thuộc tính tiện dụng của các ước tính khả năng tối đa.
Đối với một ví dụ - việc sử dụng các mô hình tuyến tính tổng quát là khá phổ biến và trong trường hợp đó, các tham số mô tả giá trị trung bình được ước tính theo khả năng tối đa.
Nó có thể xảy ra rằng một số tham số được ước tính bởi khả năng tối đa và những người khác thì không. Ví dụ, hãy xem xét một Poisson GLM quá liều - tham số phân tán sẽ không được ước tính theo khả năng tối đa, vì MLE không hữu ích trong trường hợp đó.
Nếu chúng ta giả sử phân phối dữ liệu, chúng ta sẽ tìm thấy hai tham số
Chà, đôi khi bạn có thể có hai, nhưng đôi khi bạn có một tham số, đôi khi ba hoặc bốn hoặc nhiều hơn.
Một cho trung bình và một cho phương sai,
Bạn đang nghĩ về một mô hình cụ thể có lẽ? Đây không phải là luôn luôn như vậy. Xem xét ước tính tham số của phân phối theo cấp số nhân hoặc phân phối Poisson hoặc phân phối nhị thức. Trong mỗi trường hợp đó, có một tham số và phương sai là một hàm của tham số mô tả giá trị trung bình.
Hoặc xem xét một phân phối gamma tổng quát , trong đó có ba tham số. Hoặc bản phân phối beta gồm bốn tham số , có (có lẽ không ngạc nhiên) bốn tham số. Cũng lưu ý rằng (tùy thuộc vào tham số cụ thể) giá trị trung bình hoặc phương sai hoặc cả hai có thể không được biểu thị bằng một tham số duy nhất mà bằng các chức năng của một vài trong số chúng.
Ví dụ, sự phân bố gamma, mà có ba tham số hoá mà thấy sử dụng khá phổ biến - các chung hai hầu hết trong số đó có chức năng cả hai giá trị trung bình và phương sai là của hai tham số.
Thông thường trong mô hình hồi quy hoặc GLM hoặc mô hình sống sót (trong số nhiều loại mô hình khác), mô hình có thể phụ thuộc vào nhiều yếu tố dự đoán, trong trường hợp phân phối được liên kết với mỗi quan sát trong mô hình có thể có một tham số riêng (hoặc thậm chí một vài tham số) có liên quan đến nhiều biến dự đoán ("biến độc lập").