Điều kiện thông thường có hiệu lực khi bạn đang cố gắng đạt được khoảng tin cậy và / hoặc giá trị p.
ε|X∼N(0,σ2In) không phải là điều kiện Gauss Markov .
Biểu đồ này cố gắng minh họa sự phân bố các điểm trong dân số bằng màu xanh lam (với đường hồi quy dân số là một đường màu lục lam), được đặt trên một tập dữ liệu mẫu trong các chấm màu vàng lớn (với đường hồi quy ước tính được vẽ ở đường màu vàng nét đứt). Rõ ràng điều này chỉ dành cho tiêu dùng theo khái niệm, vì sẽ có các điểm vô cực cho mỗi giá trị ) - vì vậy đây là sự phân biệt biểu tượng đồ họa của khái niệm hồi quy khi phân phối liên tục các giá trị xung quanh giá trị trung bình (tương ứng với giá trị dự đoán của biến "độc lập") tại mỗi giá trị đã cho của biến hồi quy hoặc biến giải thích.X=x
Nếu chúng tôi chạy các ô chẩn đoán R trên dữ liệu "dân số" mô phỏng, chúng tôi sẽ nhận được ...
Phương sai của phần dư là không đổi dọc theo tất cả các giá trị củaX.
Cốt truyện điển hình sẽ là:
Về mặt khái niệm, việc giới thiệu nhiều biến hồi quy hoặc biến giải thích không làm thay đổi ý tưởng. Tôi thấy hướng dẫn thực hành của gói swirl()
cực kỳ hữu ích trong việc hiểu làm thế nào nhiều hồi quy thực sự là một quá trình hồi quy các biến phụ thuộc với nhau mang lại sự thay đổi còn lại, không giải thích được trong mô hình; hoặc đơn giản hơn, một dạng véc tơ của hồi quy tuyến tính đơn giản :
Kỹ thuật chung là chọn một biến hồi quy và thay thế tất cả các biến khác bằng phần dư của hồi quy của chúng so với biến đó.
E[ ε2i | X ]=σ2
Các vấn đề với vi phạm điều kiện này là:
Sự không đồng nhất có những hậu quả nghiêm trọng đối với người ước tính OLS. Mặc dù công cụ ước tính OLS vẫn không thiên vị, SE ước tính là sai. Bởi vì điều này, khoảng tin cậy và các giả thuyết kiểm tra không thể dựa vào. Ngoài ra, công cụ ước tính OLS không còn XANH LÁ.
Trong biểu đồ này, phương sai tăng theo các giá trị của biến hồi quy (biến giải thích), trái ngược với hằng số. Trong trường hợp này, phần dư được phân phối bình thường, nhưng phương sai của phân phối bình thường này thay đổi (tăng) với biến giải thích.
Lưu ý rằng đường hồi quy "thực" (dân số) không thay đổi đối với đường hồi quy dân số theo độ đồng nhất trong ô thứ nhất (màu xanh đậm), nhưng rõ ràng bằng trực giác rằng các ước tính sẽ không chắc chắn hơn.
Các lô chẩn đoán trên tập dữ liệu là ...
tương ứng với phân phối "đuôi nặng" , điều có ý nghĩa là chúng ta đã kính thiên văn tất cả các âm mưu Gaussian dọc "cạnh nhau" thành một hình duy nhất, sẽ giữ lại hình dạng chuông của nó, nhưng có đuôi rất dài.
@Glen_b "... một phạm vi bảo hiểm đầy đủ về sự khác biệt giữa hai người cũng sẽ xem xét homoskedastic-nhưng-không-bình thường."
Phần dư bị lệch nhiều và phương sai tăng theo các giá trị của biến giải thích.
Đây sẽ là các lô chẩn đoán ...
tương ứng với đánh dấu xiên phải.
Để đóng vòng lặp, chúng ta cũng sẽ thấy sự sai lệch trong một mô hình homoskedastic với phân phối lỗi không theo Gaussian:
với các lô chẩn đoán như ...