Lý do tại sao các lô được sử dụng phổ biến để đưa ra hồi quy đơn giản - một phản ứng được dự đoán bởi một người dự đoán duy nhất - là vì chúng giúp hiểu biết.
Tuy nhiên, tôi tin rằng tôi có thể cung cấp một cái gì đó của hương vị có thể giúp hiểu được những gì đang xảy ra. Trong phần này, tôi chủ yếu tập trung vào việc cố gắng truyền đạt một số hiểu biết mà họ đưa ra, điều này có thể giúp với một số khía cạnh khác mà bạn thường gặp khi đọc về hồi quy. Vì vậy, câu trả lời này sẽ chủ yếu giải quyết một khía cạnh cụ thể của bài viết của bạn.
Hãy tưởng tượng bạn đang ngồi trước một chiếc bàn hình chữ nhật lớn như bàn văn phòng đơn giản, một bàn dài đầy đủ (có lẽ là 1,8 mét), có lẽ rộng bằng một nửa.
Bạn đang ngồi trước bàn ở vị trí thông thường, ở giữa một bên dài. Trên bàn này, một số lượng lớn móng tay (với đầu khá nhẵn) đã được đóng vào bề mặt trên cùng để mỗi cái nhô lên một chút (đủ để cảm nhận vị trí của chúng và đủ để buộc một chuỗi vào chúng hoặc gắn một dải cao su ).
Những chiếc đinh này ở các khoảng cách khác nhau từ cạnh bàn của bạn, theo cách mà về phía một đầu (nói là đầu bên trái) chúng thường ở gần cạnh bàn của bạn và sau đó khi bạn di chuyển về phía đầu kia của đầu đinh có xu hướng xa hơn từ cạnh của bạn.
Hơn nữa hãy tưởng tượng rằng sẽ rất hữu ích khi có ý thức về việc trung bình móng tay cách mép của bạn ở bất kỳ vị trí nào dọc theo cạnh của bạn.
Chọn một nơi nào đó dọc theo cạnh bàn của bạn và đặt bàn tay của bạn ở đó, sau đó đưa thẳng về phía trước bàn, nhẹ nhàng kéo tay bạn về phía bạn, sau đó lại đi, di chuyển bàn tay qua lại trên đầu móng tay. Bạn gặp phải vài chục vết sưng từ những chiếc đinh này - những cái nằm trong phạm vi hẹp của bàn tay bạn (khi nó di chuyển trực tiếp ra khỏi cạnh của bạn, ở khoảng cách không đổi từ đầu bên trái của bàn làm việc), một phần hoặc dải, rộng khoảng mười cm .
Ý tưởng là tìm ra một khoảng cách trung bình đến một cái đinh từ cạnh bàn của bạn trong phần nhỏ đó. Theo trực giác, đó chỉ là phần giữa của những cú va chạm mà chúng ta đạt được nhưng nếu chúng ta đo từng khoảng cách từ móng tay trong phần bàn rộng bằng bàn tay đó, chúng ta có thể tính toán những mức trung bình đó một cách dễ dàng.
Ví dụ: chúng ta có thể sử dụng một hình vuông chữ T có đầu trượt dọc theo cạnh bàn và trục của nó chạy về phía bên kia của bàn, nhưng ngay phía trên bàn để chúng ta không chạm vào móng tay khi nó trượt sang trái hoặc bên phải - khi chúng ta vượt qua một chiếc đinh nhất định, chúng ta có thể có được khoảng cách của nó dọc theo trục của hình vuông T.
Vì vậy, trong quá trình phát triển của các địa điểm dọc theo rìa của chúng tôi, chúng tôi lặp lại bài tập tìm kiếm tất cả các đinh trong một dải rộng bằng tay chạy về phía trước và cách xa chúng tôi và tìm khoảng cách trung bình của chúng. Có lẽ chúng tôi chia bàn làm việc thành các dải rộng bằng tay dọc theo cạnh của chúng tôi (vì vậy mọi móng tay đều bắt gặp trong đúng một dải).
Bây giờ hãy tưởng tượng có 21 dải như vậy, đầu tiên ở cạnh trái và cuối cùng ở cạnh phải. Các phương tiện có thể đi xa hơn từ cạnh bàn của chúng tôi khi chúng tôi tiến qua các dải.
Những phương tiện này tạo thành một công cụ ước lượng hồi quy không đối xứng đơn giản về kỳ vọng của y (khoảng cách của chúng ta) cho x (khoảng cách dọc theo cạnh của chúng ta từ đầu bên trái), nghĩa là E (y | x). Cụ thể, đây là một công cụ ước lượng hồi quy không theo tỷ lệ, còn được gọi là hồi quy
Nếu các dải đó có nghĩa là tăng đều đặn - nghĩa là, giá trị trung bình thường tăng theo cùng một lượng trên mỗi dải khi chúng ta di chuyển trên các dải - thì chúng ta có thể ước tính tốt hơn hàm hồi quy của mình bằng cách giả sử rằng giá trị dự kiến của y là tuyến tính hàm của x - tức là giá trị mong đợi của y đã cho x là hằng số cộng với bội số của x. Ở đây hằng số biểu thị nơi móng có xu hướng khi chúng ta ở x bằng 0 (thường chúng ta có thể đặt nó ở cạnh cực bên trái nhưng nó không phải như vậy) và bội số cụ thể của x là trung bình nhanh như thế nào thay đổi khi chúng ta di chuyển một centimet (nói) sang phải.
Nhưng làm thế nào để tìm một hàm tuyến tính như vậy?
Hãy tưởng tượng rằng chúng ta vòng một dải cao su trên mỗi đầu móng tay và gắn mỗi dải vào một thanh mỏng dài đặt ngay phía trên bàn, trên đầu móng tay, để nó nằm ở đâu đó gần "giữa" của mỗi dải chúng ta có cho
Chúng tôi gắn các dải theo cách chúng chỉ kéo dài theo hướng về phía trước và cách xa chúng tôi (không phải trái hay phải) - trái với chính chúng, chúng sẽ kéo theo để làm cho hướng của chúng kéo dài theo một góc phải bằng gậy, nhưng ở đây chúng tôi ngăn chặn điều đó, để hướng kéo dài của chúng chỉ còn lại theo hướng về phía hoặc ra khỏi cạnh bàn của chúng tôi. Bây giờ chúng ta để thanh ổn định khi các dải kéo nó về phía mỗi móng, với móng ở xa hơn (với các dải cao su kéo dài hơn) kéo tương ứng cứng hơn đinh gần với gậy.
Sau đó, kết quả tổng hợp của tất cả các dải kéo trên thanh sẽ là (lý tưởng nhất là ít nhất) để kéo thanh để giảm thiểu tổng chiều dài bình phương của các dải cao su kéo dài; theo hướng đó trực tiếp trên bàn, khoảng cách từ cạnh bàn của chúng ta đến thanh tại bất kỳ vị trí x đã cho nào sẽ là ước tính của chúng ta về giá trị dự kiến của y cho x.
Đây thực chất là một ước tính hồi quy tuyến tính.
Bây giờ, hãy tưởng tượng rằng thay vì móng tay, chúng ta có nhiều trái cây (như táo nhỏ) có thể treo trên cây lớn và chúng ta muốn tìm khoảng cách trung bình của trái cây trên mặt đất vì nó thay đổi theo vị trí trên mặt đất. Hãy tưởng tượng rằng trong trường hợp này, độ cao trên mặt đất sẽ lớn hơn khi chúng ta tiến lên và lớn hơn một chút khi chúng ta di chuyển sang phải, một lần nữa theo cách thông thường, do đó, mỗi bước tiến thường thay đổi chiều cao trung bình khoảng một lượng tương tự, và mỗi bước tới bên phải cũng sẽ thay đổi giá trị trung bình theo một lượng gần như không đổi (nhưng lượng thay đổi trung bình theo bước này khác với lượng thay đổi từng bước).
Nếu chúng ta thu nhỏ tổng khoảng cách vuông góc từ quả thành một tấm phẳng mỏng (có lẽ là một tấm nhựa mỏng rất cứng) để tìm ra chiều cao trung bình thay đổi khi chúng ta tiến lên hoặc bước sang phải, thì đó sẽ là hồi quy tuyến tính với hai yếu tố dự báo - hồi quy bội.
Đây là hai trường hợp duy nhất mà cốt truyện có thể giúp hiểu (chúng có thể hiển thị nhanh chóng những gì tôi vừa mô tả, nhưng hy vọng bạn biết có cơ sở để khái niệm hóa các ý tưởng tương tự). Ngoài hai trường hợp đơn giản nhất, chúng ta chỉ còn lại toán học.
Bây giờ lấy ví dụ về giá nhà của bạn; bạn có thể đại diện cho diện tích của mọi ngôi nhà theo một khoảng cách dọc theo cạnh bàn của bạn - đại diện cho kích thước ngôi nhà lớn nhất là một vị trí gần cạnh phải, mọi kích thước ngôi nhà khác sẽ ở một vị trí xa hơn về phía bên trái nơi một số cm nhất định sẽ đại diện cho một số số mét vuông. Bây giờ khoảng cách xa đại diện cho giá bán. Đại diện cho ngôi nhà đắt nhất vì một số khoảng cách cụ thể gần cạnh xa nhất của bàn làm việc (như mọi khi, cạnh xa nhất từ ghế của bạn), và mỗi centimet chuyển đi sẽ đại diện cho một số Rials.
Đối với hiện tại hãy tưởng tượng rằng chúng tôi đã chọn đại diện sao cho cạnh trái của bàn tương ứng với diện tích nhà bằng 0 và cạnh gần với giá nhà là 0. Sau đó chúng tôi đặt một cái đinh cho mỗi ngôi nhà.
Chúng tôi có lẽ sẽ không có móng tay nào ở gần đầu bên trái của chúng tôi (chúng có thể chủ yếu ở bên phải và cách xa chúng tôi) bởi vì đây không nhất thiết là một lựa chọn tốt về quy mô nhưng sự lựa chọn của bạn về mô hình không chặn làm cho điều này một cách tốt hơn để thảo luận về nó.
Bây giờ trong mô hình của bạn, bạn buộc thanh đi qua một chuỗi chuỗi ở góc trái của cạnh gần của bàn - do đó buộc mô hình được trang bị có giá bằng 0 cho khu vực 0, có vẻ tự nhiên - nhưng hãy tưởng tượng nếu có một số thành phần khá ổn định của giá mà ảnh hưởng đến mỗi lần bán. Sau đó, sẽ có ý nghĩa khi đánh chặn khác 0.
Trong mọi trường hợp, với việc bổ sung vòng lặp đó, bài tập dây cao su tương tự như trước đây sẽ tìm thấy ước tính bình phương nhỏ nhất của dòng.