Cách tốt nhất để suy nghĩ về điều này là tưởng tượng một biểu đồ phân tán các điểm có trên trục tung và x được biểu thị bằng trục hoành. Dựa vào khung này, bạn sẽ thấy một đám mây điểm, có thể là hình tròn mơ hồ hoặc có thể được kéo dài thành hình elip. Những gì bạn đang cố gắng thực hiện trong hồi quy là tìm thứ có thể được gọi là 'dòng phù hợp nhất'. Tuy nhiên, trong khi điều này có vẻ đơn giản, chúng ta cần tìm ra ý nghĩa của từ 'tốt nhất' và điều đó có nghĩa là chúng ta phải xác định những gì sẽ là tốt cho một dòng hoặc tốt hơn một dòng tốt hơn một dòng khác, v.v. , chúng ta phải quy định một chức năng mấtyx. Hàm mất mát cung cấp cho chúng ta một cách để nói mức độ "xấu" của một cái gì đó, và do đó, khi chúng ta giảm thiểu điều đó, chúng ta sẽ tạo ra dòng 'tốt nhất có thể' hoặc tìm dòng 'tốt nhất'.
Theo truyền thống, khi chúng tôi tiến hành phân tích hồi quy, chúng tôi tìm thấy các ước tính về độ dốc và đánh chặn để giảm thiểu tổng các lỗi bình phương . Chúng được định nghĩa như sau:
SSE=∑i=1N(yi−(β^0+β^1xi))2
Về mặt phân tán của chúng tôi, điều này có nghĩa chúng ta đang giảm thiểu (tổng các bình phương) khoảng cách thẳng đứng giữa các điểm dữ liệu quan sát và dòng.
Mặt khác, hoàn toàn hợp lý khi hồi quy lên y , nhưng trong trường hợp đó, chúng ta sẽ đặt x trên trục tung, v.v. Nếu chúng ta giữ nguyên âm mưu của mình (với x trên trục hoành), hồi quy x lên y (một lần nữa, sử dụng phiên bản điều chỉnh một chút của phương trình trên với x và y đã chuyển) có nghĩa là chúng ta sẽ giảm thiểu tổng khoảng cách ngangxyxxxyxygiữa các điểm dữ liệu quan sát và đường. Điều này nghe có vẻ rất giống nhau, nhưng không hoàn toàn giống nhau. (Cách nhận biết điều này là thực hiện cả hai cách, và sau đó chuyển đổi một cách đại số một bộ ước tính tham số thành các điều khoản của mô hình kia. So sánh mô hình đầu tiên với phiên bản được sắp xếp lại của mô hình thứ hai, chúng ta dễ dàng nhận ra rằng chúng là không giống nhau.)
Lưu ý rằng không có cách nào tạo ra cùng một dòng chúng ta sẽ vẽ bằng trực giác nếu ai đó đưa cho chúng ta một mảnh giấy vẽ đồ thị với các điểm được vẽ trên đó. Trong trường hợp đó, chúng ta sẽ vẽ một đường thẳng qua tâm, nhưng giảm thiểu khoảng cách theo chiều dọc sẽ tạo ra một đường thẳng hơn một chút (nghĩa là với độ dốc nông hơn), trong khi giảm thiểu khoảng cách ngang sẽ tạo ra một đường dốc hơn một chút .
Một mối tương quan là đối xứng; tương quan với y như y với x . Tuy nhiên, mối tương quan thời điểm sản phẩm Pearson có thể được hiểu trong bối cảnh hồi quy. Hệ số tương quan, r , là độ dốc của đường hồi quy khi cả hai biến đã được chuẩn hóa trước. Đó là, trước tiên bạn trừ đi giá trị trung bình từ mỗi quan sát, sau đó chia sự khác biệt cho độ lệch chuẩn. Bây giờ, đám mây của các điểm dữ liệu sẽ được tập trung vào điểm gốc và độ dốc sẽ giống nhau cho dù bạn có hồi quy y trên x hay x trên yxyyxryxxy (nhưng lưu ý nhận xét của @DilipSarwate bên dưới).
Bây giờ, tại sao điều này lại quan trọng? Sử dụng hàm mất truyền thống của chúng tôi, chúng tôi đang nói rằng tất cả các lỗi chỉ nằm trong một trong các biến (viz., ). Đó là, chúng tôi đang nói rằng x được đo không có lỗi và tạo thành tập hợp các giá trị chúng tôi quan tâm, nhưng y có lỗi lấy mẫuyxy. Điều này rất khác với việc nói ngược lại. Điều này rất quan trọng trong một tập phim lịch sử thú vị: Vào cuối thập niên 70 và đầu thập niên 80 ở Mỹ, vụ án được đưa ra là có sự phân biệt đối xử với phụ nữ tại nơi làm việc và điều này được hỗ trợ bằng các phân tích hồi quy cho thấy phụ nữ có hoàn cảnh bình đẳng (ví dụ , trình độ, kinh nghiệm, vv) được trả tiền, trung bình, ít hơn nam giới. Các nhà phê bình (hoặc chỉ những người cực kỳ kỹ lưỡng) lập luận rằng nếu điều này là đúng, phụ nữ được trả công bằng với đàn ông sẽ phải có trình độ cao hơn, nhưng khi điều này được kiểm tra, người ta thấy rằng mặc dù kết quả là 'đáng kể' khi đánh giá theo một cách, chúng không "đáng kể" khi được kiểm tra theo cách khác, điều này đã khiến mọi người liên quan đến một cách chóng mặt. Xem tại đây cho một bài báo nổi tiếng đã cố gắng để làm rõ vấn đề.
(Cập nhật nhiều sau) Đây là một cách khác để suy nghĩ về vấn đề này tiếp cận chủ đề thông qua các công thức thay vì trực quan:
Công thức cho độ dốc của đường hồi quy đơn giản là hệ quả của hàm mất mát đã được áp dụng. Nếu bạn đang sử dụng chức năng mất bình phương tối thiểu bình thường tiêu chuẩn (đã lưu ý ở trên), bạn có thể rút ra công thức cho độ dốc mà bạn thấy trong mỗi sách giáo khoa giới thiệu. Công thức này có thể được trình bày dưới nhiều hình thức khác nhau; một trong số đó tôi gọi là công thức 'trực quan' cho độ dốc. Hãy xem xét biểu mẫu này cho cả hai tình huống mà bạn đang suy thoái trên x , và nơi bạn đang suy thoái x trên y :
y trên x ⏞ beta 1 = cov ( x , y )yxxy
Bây giờ, tôi hy vọng rõ ràng rằng những điều này sẽ không giống nhau trừ khiVar(x)bằng vớiVar(y). Nếu chênh lệchlàbằng nhau (ví dụ, bởi vì bạn chuẩn các biến đầu tiên), sau đó như vậy là độ lệch chuẩn, và do đó sự chênh lệch sẽ cả cũng tương đươngSD(x)SD(y). Trong trường hợp này,β1sẽ bằng Pearsonr, đó là một trong hai cách tương tự nhờnguyên tắc giao hoán:
tương ứng
β^1=Cov(x,y)Var(x)y on x β^1=Cov(y,x)Var(y)x on y
Var(x)Var(y)SD(x)SD(y)β^1rr=Cov(x,y)SD(x)SD(y)correlating x with y r=Cov(y,x)SD(y)SD(x)correlating y with x