Tôi hơi bối rối với câu trả lời ở trên, do đó tôi sẽ cho nó một phát nữa. Tôi nghĩ rằng câu hỏi không thực sự là về hồi quy tuyến tính 'cổ điển' mà là về phong cách của nguồn cụ thể đó. Về phần hồi quy cổ điển:
Tuy nhiên, giả định tuyến tính tự nó không đặt bất kỳ cấu trúc nào lên mô hình của chúng tôi
Điều đó là hoàn toàn chính xác. Như bạn đã nói, có thể giết chết mối quan hệ tuyến tính và thêm một cái gì đó hoàn toàn độc lập với để chúng ta không thể tính toán bất kỳ mô hình nào cả.XϵX
Là Greene đang cẩu thả? Anh ta thực sự nên viết:E(y|X)=Xβ
Tôi không muốn trả lời câu hỏi đầu tiên nhưng hãy để tôi tổng hợp các giả định bạn cần cho hồi quy tuyến tính thông thường:
Giả sử bạn quan sát (bạn được cung cấp) các điểm dữ liệu và cho . Bạn cần giả sử rằng dữ liệu bạn đã quan sát xuất phát từ các biến ngẫu nhiên độc lập, phân phối giống hệt nhau sao cho ...y i ∈ R i = 1 , . . . , n ( x i , y i ) ( X i , Y i )xi∈Rdyi∈Ri=1,...,n(xi,yi)(Xi,Yi)
tại một cố định (độc lập với ) sao cho cho tất cả và các biến ngẫu nhiên sao choiβ∈RdYi=βXi+ϵiiϵi
Các được IID cũng và được phân phối như ( phải độc lập của cũng)ϵiϵiN(0,σ)σi
Với và các biến có mật độ chung, tức là biến ngẫu nhiên đơn có mật độX=(X1,...,Xn)Y=(Y1,...,Yn)X,Y(X,Y)fX,Y
Bây giờ bạn có thể chạy xuống đường dẫn thông thường và tính toán
fY|X(y|x)=fY,X(y,x)/fX(x)=(12πd−−−√)nexp(−∑ni=1(yi−βxi)22σ)
sao cho bằng 'tính hai mặt' thông thường giữa học máy (tối thiểu hóa các hàm lỗi) và lý thuyết xác suất (tối đa hóa khả năng) bạn tối đa hóa trong , thực tế, mang đến cho bạn các công cụ "RMSE" thông thường.−logfY|X(y|x)β
Bây giờ như đã nêu: Nếu tác giả của cuốn sách bạn đang trích dẫn muốn đưa ra quan điểm này (điều bạn phải làm nếu bạn muốn tính toán đường hồi quy 'tốt nhất có thể' trong thiết lập cơ bản) thì có, anh ta phải đưa ra giả định này về tính bình thường của ở đâu đó trong cuốn sách.ϵ
Có nhiều khả năng khác nhau:
Ông không viết giả định này trong cuốn sách. Sau đó, nó là một lỗi trong cuốn sách.
Anh ta viết nó dưới dạng một nhận xét 'toàn cầu' như 'bất cứ khi nào tôi viết thì thường được phân phối với số 0 trung bình trừ khi có quy định khác'. Sau đó IMHO nó là phong cách xấu bởi vì nó gây ra chính xác sự nhầm lẫn mà bạn cảm thấy ngay bây giờ. Đó là lý do tại sao tôi có xu hướng viết các giả định ở một số dạng rút gọn trong mọi Định lý. Chỉ sau đó mỗi khối xây dựng có thể được xem sạch theo cách riêng của mình.+ϵϵ
- Anh ấy viết nó sát với phần bạn đang trích dẫn và bạn / chúng tôi không nhận thấy điều đó (cũng có khả năng :-))
Tuy nhiên, cũng theo một nghĩa toán học nghiêm ngặt, lỗi thông thường là một cái gì đó kinh điển (phân phối với entropy cao nhất [một khi phương sai được cố định], do đó, tạo ra các mô hình mạnh nhất) để một số tác giả có xu hướng bỏ qua giả định này nhưng sử dụng không cần thiết . Chính thức, bạn hoàn toàn đúng: Họ đang sử dụng toán học theo "cách sai". Bất cứ khi nào họ muốn đưa ra phương trình cho mật độ như đã nêu ở trên thì họ cần phải biết khá tốt, nếu không, bạn chỉ cần có các thuộc tính của nó bay xung quanh trong mọi phương trình có ý nghĩa mà bạn cố gắng viết ra . ϵfY|Xϵ