Điều quan trọng là phải chính xác trong những tình huống này và phân biệt giữa mô hình dữ liệu và chính dữ liệu. Một cách để suy nghĩ về hồi quy tuyến tính là chúng tôi đưa ra giả thuyết về mối quan hệ sau đây về quy trình thống kê không thể biết được đã tạo ra dữ liệu chúng tôi có
E[ Y∣ X] =β0+ Xβ
Beta là một hằng số chưa biết tại thời điểm này, vì vậy chúng tôi chỉ đặt ra một giả thuyết về những gì chúng tôi tin rằng hình dạng của mối quan hệ là như thế nào. Sau đó, được cung cấp dữ liệu, chúng tôi sử dụng một số phương pháp để xác định nên là gì để mối quan hệ được đưa ra giả thuyết có khả năng tạo ra dữ liệu chúng tôi có (khả năng tối đa là rất phổ biến).β
Ngay cả khi không biết , chúng ta có thể điều khiển mối quan hệ để tìm hiểu một số điều về hậu quả của các giả định của mìnhβ
E[ Y] = E[ E[ Y∣ X] ] =β0+ βE[ X] =β0+ βE[ X]
Bây giờ, sự phân phối của nói chung không phải là một phần của các giả định cấu trúc của chúng ta trong hồi quy, do đó, nói chung, điều này là xa như chúng ta có thể đi.X
Thông thường, chúng tôi sẽ tập trung dữ liệu của mình cho , áp đặt ràng buộc trên mô hình của chúng tôi. Trong trường hợp này, chúng ta có thể rút raXE[ X] = 0
E[ Y] =β0
Đây là lý do tại sao, ví dụ , cuốn sách này khuyến nghị các dự đoán trung tâm (trong một số tình huống) để việc chặn mô hình có thể hiểu được.
Bây giờ, câu hỏi của tôi là làm thế nào điều này có liên quan đến trung bình mẫu của y?
Nếu bạn khớp với mô hình theo các ô vuông nhỏ nhất và bạn đã căn giữa bộ dự đoán , thì mô hình chặn là trung bình mẫu.x
Về mặt hình học, đường bình phương nhỏ nhất phải đi qua tâm khối lượng của dữ liệu . Khi bạn có tâm , , do đó dòng đi qua . Nếu bạn cắm các giá trị này vào phương trình mô hình, bạn sẽ nhận được .(x¯,y¯)xx¯= 0( 0 ,y¯)β0= =y¯
Theo đại số, phương trình bình phương nhỏ nhất là . Nếu bạn nghĩ về ma trận , cột đầu tiên là tất cả các cột (cột chặn) và vì là trung tâm, cột chặn này là trực giao với cột dữ liệu. Điều này có nghĩa là hàng đầu tiên của trông giống như (trong đó là số điểm dữ liệu). Sau đó, thành phần đầu tiên của phía bên trái là . Ở phía bên phải, thành phần đầu tiên là . Tương đương với chúng, bạn nhận được kết quả .(XtX)β⃗ = =XtyXxXtX( N, 0 )NNβ0ΣTôiyTôiβ0= =y¯
Cũng đúng là giá trị trung bình của các dự đoán bằng với . Vì đây là các phương tiện có điều kiện ước tính (theo giả định), điều này mang lại cho bạn một mối quan hệ giống như mối quan hệ bạn tìm kiếm. Để thấy điều này, chỉ cần quan sát rằng các dự đoán là và nhóm phương trình bình phương nhỏ nhất lày¯Xβ⃗
Xt( Xβ⃗ ) = =Xty
Bây giờ sử dụng một đối số tương tự như những gì tôi đã làm ở trên.