Tại sao ước tính OLS liên quan đến việc lấy độ lệch dọc của các điểm đến đường hơn là khoảng cách ngang?
Tại sao ước tính OLS liên quan đến việc lấy độ lệch dọc của các điểm đến đường hơn là khoảng cách ngang?
Câu trả lời:
OLS ( bình phương tối thiểu thông thường ) giả định rằng các giá trị được biểu thị bằng khoảng cách ngang được xác định trước bởi người thử nghiệm hoặc được đo với độ chính xác cao (so với khoảng cách dọc). Khi có một câu hỏi về sự không chắc chắn trong khoảng cách ngang, bạn không nên sử dụng OLS, mà thay vào đó nên xem xét các mô hình lỗi trong biến hoặc, có thể, phân tích thành phần chính .
Câu hỏi thú vị. Câu trả lời của tôi sẽ là khi chúng ta lắp một mô hình OLS, chúng ta hoàn toàn cố gắng dự đoán / giải thích biến phụ thuộc trong tay - chữ "Y" trong "Y vs X." Do đó, mối quan tâm chính của chúng tôi sẽ là giảm thiểu khoảng cách từ đường được trang bị của chúng tôi đến các quan sát thực tế liên quan đến kết quả, có nghĩa là giảm thiểu khoảng cách dọc. Điều này tất nhiên xác định phần dư.
Ngoài ra, các công thức bình phương tối thiểu dễ dàng rút ra hơn so với hầu hết các phương pháp cạnh tranh khác, có lẽ đó là lý do tại sao nó xuất hiện đầu tiên. : P
Như 'ám chỉ' ở trên, có những cách tiếp cận khác đối xử với X và Y với sự nhấn mạnh bằng nhau khi phù hợp với một dòng phù hợp nhất. Một cách tiếp cận mà tôi biết là hồi quy "đường chính" hoặc "đường cong chính", giúp giảm thiểu khoảng cách trực giao giữa các điểm và đường thẳng (thay vì đường lỗi dọc mà bạn có ở góc 90 độ so với đường được trang bị) . Tôi đăng một tài liệu tham khảo dưới đây để đọc của bạn. Nó dài nhưng rất dễ tiếp cận và khai sáng.
Hy vọng điều này sẽ giúp, Brenden
Nó cũng có thể liên quan đến các thí nghiệm được thiết kế - nếu x là đại lượng được kiểm soát là một phần của thiết kế thử nghiệm, thì nó được coi là xác định; trong khi y là kết quả và là một đại lượng ngẫu nhiên. x có thể là một đại lượng liên tục (ví dụ: nồng độ của một số loại thuốc) nhưng có thể là mức chia 0/1 (dẫn đến thử nghiệm t 2 mẫu với giả sử y là Gaussian). Nếu x là một đại lượng liên tục có thể có một số lỗi đo lường, nhưng thông thường nếu giá trị này nhỏ hơn nhiều so với độ biến thiên của y thì điều này bị bỏ qua.