Có (ít nhất) ba giác quan trong đó hồi quy có thể được coi là "tuyến tính". Để phân biệt chúng, hãy bắt đầu với một mô hình hồi quy cực kỳ chung
Y=f(X,θ,ε).
Để giữ cho cuộc thảo luận đơn giản, hãy lấy các biến độc lập được cố định và đo chính xác (thay vì các biến ngẫu nhiên). Họ mô hình n quan sát của p thuộc tính mỗi, làm phát sinh các n -vector phản ứng Y . Thông thường, X được biểu diễn dưới dạng ma trận n × p và Y là cột n -vector. Các (hữu hạn q -vector) θ bao gồm các thông số . ε là một biến ngẫu nhiên vector có giá trị. Nó thường có nXnpnYXn×pYnqθεncác thành phần, nhưng đôi khi có ít hơn. Chức năng là vector có giá trị (với n thành phần để phù hợp với Y ) và thường được giả định liên tục trong hai đối số cuối cùng của nó ( θ và ε ).fnYθε
Ví dụ nguyên mẫu , về việc khớp một dòng với dữ liệu , là trường hợp X là một vectơ của các số ( x i ,(x,y)X --Thư x-giá trị; Y là một vectơ song song của n số ( y i ) ; θ = ( α , β ) cung cấp cho các đánh chặn α và độ dốc β ; và ε = ( ε 1 , ε 2 , ... , ε n )(xi,i=1,2,…,n)Yn(yi)θ=(α,β)αβε=(ε1,ε2,…,εn)là một vectơ của "lỗi ngẫu nhiên" có các thành phần độc lập (và thường được giả định là có các phân phối giống hệt nhau nhưng chưa biết về giá trị trung bình bằng 0). Trong ký hiệu trước,
yi=α+βxi+εi=f(X,θ,ε)i
với .θ=(α,β)
Hàm hồi quy có thể là tuyến tính trong bất kỳ (hoặc tất cả) ba đối số của nó:
"Hồi quy tuyến tính, hay" mô hình tuyến tính ", thông thường có nghĩa là là tuyến tính như là một hàm của các tham số θ . Ý nghĩa của SAS là" hồi quy phi tuyến " theo nghĩa này, với giả định được thêm vào rằng f là khác biệt trong đối số thứ hai của nó (các tham số). Giả định này giúp tìm giải pháp dễ dàng hơn.f θf
Một "mối quan hệ tuyến tính giữa và Y " có nghĩa là f là tuyến tính là một hàm của X .XYfX
Một mô hình có lỗi cộng khi là tuyến tính trong ε . Trong những trường hợp như vậy, luôn luôn giả sử rằng E ( ε ) = 0 . (Nếu không, nó sẽ không có quyền nghĩ về ε là "lỗi" hoặc "sai lệch" từ giá trị "đúng".)fεE(ε)=0ε
Mọi sự kết hợp có thể của các đặc điểm này có thể xảy ra và hữu ích. Hãy khảo sát các khả năng.
Một mô hình tuyến tính của một mối quan hệ tuyến tính với các lỗi phụ gia. Đây là hồi quy (nhiều) thông thường, đã được trình bày ở trên và thường được viết là
Y=Xθ+ε.
đã được tăng cường, nếu cần thiết, bởi liền kề một cột của các hằng số, và θ là một p -vector.Xθp
Một mô hình tuyến tính của mối quan hệ phi tuyến với các lỗi phụ gia. Điều này có thể được xem như là một hồi quy bội bằng cách tăng các cột của với các hàm phi tuyến của chính X. Ví dụ,XX
yi=α+βx2i+ε
là của hình thức này. Đây là tuyến tính trong ; nó có lỗi phụ gia; và nó là tuyến tính trong các giá trị ( 1 , x 2 i ) mặc dù x 2 i là hàm phi tuyến của x i .θ=(α,β)(1,x2i)x2ixi
Một mô hình tuyến tính của một mối quan hệ tuyến tính với các lỗi không tăng. Một ví dụ là lỗi nhân,
yi=(α+βxi)εi.
(Trong những trường hợp như vậy, có thể được hiểu là "lỗi nhân" khi vị trí của ε i là 1. Tuy nhiên, ý nghĩa chính xác của vị trí không nhất thiết là kỳ vọng E ( ε i ) nữa: nó có thể là trung vị hoặc ví dụ, có nghĩa là một nhận xét tương tự về các giả định vị trí, với những sửa đổi thích hợp , trong tất cả các bối cảnh lỗi không phụ gia khác.)εiεi1E(εi)
Một mô hình tuyến tính của một mối quan hệ phi tuyến với các lỗi không tăng. ví dụ ,
yi=(α+βx2i)εi.
Một mô hình phi tuyến của mối quan hệ tuyến tính với các lỗi phụ gia. Một mô hình phi tuyến bao gồm các kết hợp của các tham số không chỉ là phi tuyến, chúng thậm chí không thể được tuyến tính hóa bằng cách thể hiện lại các tham số.
Là một phi Ví dụ, xem xét
yi=αβ+β2xi+εi.
Bằng việc xác định và β ' = β 2 , và hạn chế β ' ≥ 0 , mô hình này có thể được viết lạiα′=αββ′=β2β′≥0
yi=α′+β′xi+εi,
trưng bày nó như một mô hình tuyến tính (của mối quan hệ tuyến tính với các lỗi cộng gộp).
Như một ví dụ, xem xét
yi=α+α2xi+εi.
Không thể tìm thấy một tham số mới , tùy thuộc vào α , mà sẽ linearize này như một chức năng của α ' (trong khi vẫn giữ nó tuyến tính trong x i cũng).α′αα′xi
Một mô hình phi tuyến của mối quan hệ phi tuyến với các lỗi phụ gia.
yi=α+α2x2i+εi.
Một mô hình phi tuyến của một mối quan hệ tuyến tính với các lỗi không tăng.
yi=(α+α2xi)εi.
Một mô hình phi tuyến của một mối quan hệ phi tuyến với các lỗi không tăng.
yi=(α+α2x2i)εi.
Mặc dù chúng thể hiện tám hình thức hồi quy riêng biệt , chúng không tạo thành một hệ thống phân loại vì một số hình thức có thể được chuyển đổi thành các hình thức khác. Một ví dụ tiêu chuẩn là việc chuyển đổi mô hình tuyến tính với các lỗi không tăng (giả định có hỗ trợ tích cực)
yi=(α+βxi)εi
vào một mô hình tuyến tính của một mối quan hệ phi tuyến với các lỗi phụ qua logarit,
log(yi)=μi+log(α+βxi)+(log(εi)−μi)
Ở đây, các bản ghi hình học trung bình đã bị xóa khỏi các điều khoản lỗi (để đảm bảo họ có không có nghĩa là, theo yêu cầu) và đưa vào các điều khoản khác (trong đó giá trị của nó sẽ cần phải được ước tính ). Thật vậy, một lý do chính để thể hiện lại biến phụ thuộc Y là tạo ra một mô hình có lỗi phụ gia. Biểu thức lại cũng có thể tuyến tính hóa Y như là một hàm của một (hoặc cả hai) các tham số và các biến giải thích.μi=E(log(εi))YY
Cộng tác
Collinearity (của các vectơ cột trong ) có thể là một vấn đề trong bất kỳ hình thức hồi quy nào. Chìa khóa để hiểu điều này là nhận ra rằng cộng tuyến dẫn đến khó khăn trong việc ước tính các tham số. Trừu tượng và khá chung, so sánh hai mô hình Y = f ( X , θ , ε ) và Y = f ( X ' , θ , ε ' ) nơi X ' là X với một cột hơi thay đổi. Nếu điều này gây ra những thay đổi lớn trong các ước tínhXY=f(X,θ,ε)Y=f(X′,θ,ε′)X′X và θ ', sau đó rõ ràng là chúng ta có một vấn đề. Một cách thức mà vấn đề này có thể xảy ra là trong một mô hình tuyến tính, tuyến tính trongX(có nghĩa là, các loại (1) hoặc (5) ở trên), nơi các thành phần củaθlà trong one-to-one tương ứng với các cột củaX. Khi một cột là một tổ hợp tuyến tính không tầm thường của các cột khác, ước tính của tham số tương ứng của nó có thể là bất kỳ số thực nào. Đó là một ví dụ cực đoan về sự nhạy cảm như vậy.θ^θ^′XθX
Từ quan điểm này, rõ ràng rằng cộng tuyến là một vấn đề tiềm năng đối với các mô hình tuyến tính của các mối quan hệ phi tuyến tính (bất kể tính gây nghiện của các lỗi) và khái niệm cộng tuyến tổng quát này có thể là một vấn đề trong bất kỳ mô hình hồi quy nào. Khi bạn có các biến dư thừa, bạn sẽ gặp vấn đề khi xác định một số tham số.