Tiền đề: đây có thể là một câu hỏi ngu ngốc. Tôi chỉ biết các tuyên bố về tính chất tiệm cận MLE, nhưng tôi không bao giờ nghiên cứu các bằng chứng. Nếu tôi làm vậy, có lẽ tôi sẽ không hỏi những câu hỏi này, hoặc tôi có thể tôi sẽ nhận ra những câu hỏi này không có ý nghĩa gì ... vì vậy xin hãy dễ dàng với tôi :)
Tôi thường thấy các câu lệnh nói rằng công cụ ước tính MLE của các tham số của mô hình là không bình thường và hiệu quả. Tuyên bố thường được viết là
là
Trong đó là số lượng mẫu, là thông tin Fisher và là giá trị đúng (vectơ) . Bây giờ, vì có tham chiếu đến một mô hình thực, điều này có nghĩa là kết quả sẽ không giữ nếu mô hình không đúng?
Ví dụ: giả sử tôi mô hình đầu ra công suất từ một tuabin gió như là một hàm của tốc độ gió cộng với nhiễu Gaussian phụ gia
Tôi biết mô hình sai, vì ít nhất hai lý do: 1) thực sự tỷ lệ thuận với công suất thứ ba của V và 2) lỗi không phải là phụ gia, vì tôi đã bỏ qua các dự đoán khác không tương quan với tốc độ gió (tôi cũng biết rằng β 0 phải là 0 vì 0 tốc độ gió không có quyền lực được tạo ra, nhưng điều đó không có liên quan ở đây). Bây giờ, giả sử tôi có một cơ sở dữ liệu vô hạn về dữ liệu năng lượng và tốc độ gió từ tuabin gió của tôi. Tôi có thể vẽ bao nhiêu mẫu tôi muốn, với mọi kích cỡ. Giả sử tôi vẽ 1000 mẫu, mỗi mẫu có kích thước 100 và tính toán , ước tính MLE củaβ=(β0,β1,β2) beta 100N=500,1000,1500,...N→∞ β N(mà theo mô hình của tôi sẽ chỉ là ước tính OLS). Do đó, tôi có 1000 mẫu từ phân phối . Tôi có thể lặp lại bài tập với . Vì , phân phối của có xu hướng không bình thường, với giá trị trung bình và phương sai đã nêu? Hoặc thực tế là mô hình không chính xác làm mất hiệu lực kết quả này?
Lý do tôi hỏi là hiếm khi (nếu có) mô hình là "đúng" trong các ứng dụng. Nếu các đặc tính tiệm cận của MLE bị mất khi mô hình không đúng, thì có thể sử dụng các nguyên tắc ước lượng khác nhau, trong khi ít mạnh hơn trong một thiết lập trong đó mô hình là chính xác, có thể hoạt động tốt hơn MLE trong các trường hợp khác.
EDIT : nó đã được ghi nhận trong các ý kiến rằng khái niệm mô hình thực sự có thể có vấn đề. Tôi đã có định nghĩa sau: đưa ra một họ mô hình biểu thị bằng vectơ tham số , cho mỗi mô hình trong gia đình bạn luôn có thể viết θ
bằng cách chỉ cần xác định là . Tuy nhiên, nói chung, lỗi sẽ không trực giao với , có nghĩa là 0 và nó không nhất thiết phải có phân phối giả định trong đạo hàm của mô hình. Nếu tồn tại một giá trị sao choY - f θ ( X ) X θ 0 ϵ f có hai thuộc tính này, cũng như phân phối giả định, tôi sẽ nói mô hình là đúng. Tôi nghĩ rằng điều này có liên quan trực tiếp đến việc nói rằng , vì thuật ngữ lỗi trong phân tách
có hai tính chất nêu trên.