Có một số vấn đề ở đây.
(1) Mô hình cần phải có xác suất rõ ràng . Trong hầu hết các trường hợp, sẽ không có tập hợp tham số nào mà lhs khớp với rhs cho tất cả dữ liệu của bạn: sẽ có phần dư. Bạn cần phải đưa ra các giả định về những phần dư. Bạn có mong đợi chúng là trung bình không? Để được phân phối đối xứng? Để được phân phối bình thường?
Dưới đây là hai mô hình đồng ý với một mô hình được chỉ định nhưng cho phép hành vi còn lại khác nhau đáng kể (và do đó thường sẽ dẫn đến các ước tính tham số khác nhau). Bạn có thể thay đổi các mô hình này bằng cách thay đổi các giả định về phân phối chung của :ϵi
B: y i = β 0 exp ( β 1 x 1 i + ... + β k x k i ) + ϵ tôi .
A: yi=β0exp(β1x1i+…+βkxki+ϵi)
B: yi=β0exp(β1x1i+…+βkxki)+ϵi.
(Lưu ý rằng đây là các mô hình cho dữ liệu ; thường không có giá trị dữ liệu ước tính .)^ y tôiyiyi^
(2) Nhu cầu xử lý các giá trị 0 cho y ngụ ý mô hình đã nêu (A) vừa sai vừa không đầy đủ , vì nó không thể tạo ra giá trị 0 cho dù sai số ngẫu nhiên bằng bao nhiêu. Mô hình thứ hai ở trên (B) cho phép giá trị 0 (hoặc thậm chí âm) của y. Tuy nhiên, người ta không nên chọn một mô hình chỉ dựa trên cơ sở như vậy. Để nhắc lại # 1: điều quan trọng là phải mô hình hóa các lỗi một cách hợp lý.
(3) Tuyến tính hóa thay đổi mô hình . Thông thường, nó dẫn đến các mô hình như (A) nhưng không thích (B). Nó được sử dụng bởi những người đã phân tích dữ liệu của họ đủ để biết thay đổi này sẽ không ảnh hưởng đáng kể đến các ước tính tham số và bởi những người không biết gì về những gì đang xảy ra. (Thật khó, nhiều lần, để nói sự khác biệt.)
(4) Một cách phổ biến để xử lý khả năng của giá trị 0 là đề xuất rằng (hoặc một số biểu hiện lại của nó, chẳng hạn như căn bậc hai) có cơ hội tích cực hoàn toàn bằng không. Về mặt toán học, chúng tôi đang trộn một khối điểm (một "hàm delta") với một số phân phối khác. Những mô hình này trông như thế này:y
f(yi)θj∼F(θ);=βj0+βj1x1i+⋯+βjkxki
Trong đó là một trong những tham số ẩn trong vectơ , là một số họ phân phối được tham số hóa bởi và là sự phát triển lại của (hàm "liên kết" của mô hình tuyến tính tổng quát: xem phản hồi của onestop). (Tất nhiên, sau đó, = khi ) Ví dụ là mô hình Poisson không âm và nhị phân âm .PrFθ[f(Y)=0]=θj+1>0θFθ1,…,θjfyPrFθ[f(Y)≤t](1−θj+1)Fθ(t)t≠0
(5) Các vấn đề xây dựng mô hình và lắp nó có liên quan nhưng khác nhau . Một ví dụ đơn giản, ngay cả một mô hình hồi quy thông thường có thể phù hợp theo nhiều cách bằng các bình phương tối thiểu (đưa ra các ước tính tham số tương tự như Khả năng tối đa và gần như cùng một lỗi tiêu chuẩn), lặp đi lặp lại các ô vuông nhỏ nhất , nhiều dạng khác nhau của " bình phương nhỏ nhất mạnh mẽ " , v.v ... Sự lựa chọn phù hợp thường dựa trên sự tiện lợi, kinh nghiệm ( ví dụ , tính sẵn có của phần mềm), sự quen thuộc, thói quen hoặc quy ước, nhưng ít nhất một số ý nghĩ nên là được cung cấp cho những gì phù hợp với phân phối giả định của các điều khoản lỗi , với những gìY=β0+β1X+ϵϵiHàm mất cho vấn đề có thể hợp lý và khả năng khai thác thông tin bổ sung (chẳng hạn như phân phối trước cho các tham số).