Tại sao khoảng cách dọc?

11

Tại sao ước tính OLS liên quan đến việc lấy độ lệch dọc của các điểm đến đường hơn là khoảng cách ngang?

least-squares

— người dùng333
nguồn

1

Câu hỏi cũ, nhưng tôi nghĩ việc xem dữ liệu dưới dạng mẫu phân phối xác suất được tham số hóa bởi x là hữu ích

— Bendy

12

OLS ( bình phương tối thiểu thông thường ) giả định rằng các giá trị được biểu thị bằng khoảng cách ngang được xác định trước bởi người thử nghiệm hoặc được đo với độ chính xác cao (so với khoảng cách dọc). Khi có một câu hỏi về sự không chắc chắn trong khoảng cách ngang, bạn không nên sử dụng OLS, mà thay vào đó nên xem xét các mô hình lỗi trong biến hoặc, có thể, phân tích thành phần chính .

— whuber
nguồn

"Hồi quy trực giao" là một điều khác mà người ta có thể gặp phải khi tìm kiếm các phương pháp để đối phó với các vụ bỏ trốn và phong tục bị ô nhiễm.

— JM không phải là một nhà thống kê

+1 Đây chỉ là một phân khúc duy nhất trong thống kê; các phương pháp bình phương tối thiểu phức tạp hơn (không chỉ thêm biến thiên X mà cả các hình phạt khác nhau cho các điểm dựa trên các xấp xỉ lỗi) là phổ biến trong vật lý thực nghiệm; Khung ROOT có hàng tá như vậy.

1

Câu hỏi thú vị. Câu trả lời của tôi sẽ là khi chúng ta lắp một mô hình OLS, chúng ta hoàn toàn cố gắng dự đoán / giải thích biến phụ thuộc trong tay - chữ "Y" trong "Y vs X." Do đó, mối quan tâm chính của chúng tôi sẽ là giảm thiểu khoảng cách từ đường được trang bị của chúng tôi đến các quan sát thực tế liên quan đến kết quả, có nghĩa là giảm thiểu khoảng cách dọc. Điều này tất nhiên xác định phần dư.

Ngoài ra, các công thức bình phương tối thiểu dễ dàng rút ra hơn so với hầu hết các phương pháp cạnh tranh khác, có lẽ đó là lý do tại sao nó xuất hiện đầu tiên. : P

Như 'ám chỉ' ở trên, có những cách tiếp cận khác đối xử với X và Y với sự nhấn mạnh bằng nhau khi phù hợp với một dòng phù hợp nhất. Một cách tiếp cận mà tôi biết là hồi quy "đường chính" hoặc "đường cong chính", giúp giảm thiểu khoảng cách trực giao giữa các điểm và đường thẳng (thay vì đường lỗi dọc mà bạn có ở góc 90 độ so với đường được trang bị) . Tôi đăng một tài liệu tham khảo dưới đây để đọc của bạn. Nó dài nhưng rất dễ tiếp cận và khai sáng.

Hy vọng điều này sẽ giúp, Brenden

Trevor Hastie. Đường cong chính và bề mặt , luận án tiến sĩ, Đại học Stanford; 1984

— Brenden
nguồn

1

Nó cũng có thể liên quan đến các thí nghiệm được thiết kế - nếu x là đại lượng được kiểm soát là một phần của thiết kế thử nghiệm, thì nó được coi là xác định; trong khi y là kết quả và là một đại lượng ngẫu nhiên. x có thể là một đại lượng liên tục (ví dụ: nồng độ của một số loại thuốc) nhưng có thể là mức chia 0/1 (dẫn đến thử nghiệm t 2 mẫu với giả sử y là Gaussian). Nếu x là một đại lượng liên tục có thể có một số lỗi đo lường, nhưng thông thường nếu giá trị này nhỏ hơn nhiều so với độ biến thiên của y thì điều này bị bỏ qua.

— Chris Brunsdon
nguồn