Tầm quan trọng của sự khác biệt giữa các mô hình tuyến tính và phi tuyến tính là gì? Câu hỏi Mô hình tuyến tính phi tuyến so với tổng quát: Làm thế nào để bạn đề cập đến hồi quy logistic, Poisson, v.v. và câu trả lời của nó là một sự làm rõ cực kỳ hữu ích về tính tuyến tính / phi tuyến tính của các mô hình tuyến tính tổng quát. Có vẻ rất quan trọng để phân biệt tuyến tính với các mô hình phi tuyến tính, nhưng tôi không rõ tại sao? Ví dụ, hãy xem xét các mô hình hồi quy sau:
Cả Mô hình 1 và 2 đều tuyến tính và các giải pháp để tồn tại ở dạng đóng, dễ dàng tìm thấy bằng cách sử dụng công cụ ước tính OLS tiêu chuẩn. Không phải như vậy đối với mô hình 3 và 4, đó là phi tuyến vì (một số) các dẫn xuất của E [ Y | X ] WRT β vẫn là chức năng của β .
Một giải pháp đơn giản để ước lượng trong mô hình 3 là để linearize mô hình bằng cách thiết lập γ = β 2 1 , ước tính γ sử dụng một mô hình tuyến tính, và sau đó tính toán β 1 = √ .
Để ước tính các tham số trong Mô hình 4, chúng ta có thể giả sử tuân theo phân phối nhị thức (thành viên của họ hàm mũ) và, bằng cách sử dụng thực tế rằng dạng logistic của mô hình là liên kết chính tắc, tuyến tính hóa rhs của mô hình. Đây là đóng góp tinh thần của Nelder và Wedderburn .
Nhưng tại sao sự phi tuyến tính này là một vấn đề ngay từ đầu? Tại sao người ta không thể đơn giản sử dụng một số thuật toán lặp để giải Mô hình 3 mà không tuyến tính hóa bằng cách sử dụng hàm căn bậc hai hoặc Mô hình 4 mà không cần gọi GLM. Tôi nghi ngờ rằng trước khi có sức mạnh tính toán rộng rãi, các nhà thống kê đã cố gắng tuyến tính hóa mọi thứ. Nếu đúng, thì có lẽ những "vấn đề" được giới thiệu bởi phi tuyến tính là một tàn dư của quá khứ? Là các biến chứng được đưa ra bởi các mô hình phi tuyến tính chỉ đơn thuần là tính toán, hoặc có một số vấn đề lý thuyết khác làm cho các mô hình phi tuyến tính trở nên khó khăn hơn để phù hợp với dữ liệu hơn các mô hình tuyến tính?