Lý do tôi hỏi điều này là bởi vì dường như phần dư sinh viên nội bộ dường như có mô hình giống như phần dư ước tính thô. Sẽ thật tuyệt nếu ai đó có thể đưa ra một lời giải thích.
Lý do tôi hỏi điều này là bởi vì dường như phần dư sinh viên nội bộ dường như có mô hình giống như phần dư ước tính thô. Sẽ thật tuyệt nếu ai đó có thể đưa ra một lời giải thích.
Câu trả lời:
Giả sử mô hình hồi quy với ma trận thiết kế ( cột a theo sau là các yếu tố dự đoán của bạn), dự đoán (trong đó là "ma trận mũ") và phần dư . Mô hình hồi quy giả định rằng các lỗi thực sự đều có cùng phương sai (homoskedasticity):
Ma trận hiệp phương sai của phần dư là . Điều này có nghĩa là phần dư thô có các phương sai khác nhau - đường chéo của ma trận . Các phần tử đường chéo của là các giá trị mũ .
Do đó, phần dư được chuẩn hóa thực sự với phương sai 1 trong suốt là do đó . Vấn đề là phương sai lỗi không xác định và phần dư sinh viên bên trong / bên ngoài từ các lựa chọn cụ thể cho ước tính .
Vì phần dư thô dự kiến sẽ không đồng nhất ngay cả khi là homoskedastic, nên phần dư thô về mặt lý thuyết không phù hợp để chẩn đoán các vấn đề với giả định homoskedasticity so với phần dư được chuẩn hóa hoặc học sinh.
Những loại dữ liệu bạn đã thực hiện lô thử nghiệm của bạn trên? Khi tất cả các giả định giữ (hoặc đến gần) thì tôi sẽ không mong đợi nhiều sự khác biệt giữa phần dư và học sinh, lợi thế chính là khi có những điểm có ảnh hưởng lớn. Xem xét dữ liệu (mô phỏng) này có xu hướng tuyến tính tích cực và ngoại lệ có ảnh hưởng lớn:
Dưới đây là biểu đồ của các giá trị được trang bị so với phần dư:
Lưu ý rằng giá trị của phần dư của điểm ảnh hưởng của chúng ta gần bằng 0 hơn phần dư tối thiểu và tối đa từ các điểm còn lại (nó không nằm trong 3 phần dư cực nhất).
Bây giờ đây là cốt truyện với phần dư được chuẩn hóa (nội bộ học sinh):
Trong cốt truyện này, phần dư được chuẩn hóa nổi bật vì ảnh hưởng của nó đã được tính đến.
Trong ví dụ đơn giản này, thật dễ dàng để xem điều gì đang xảy ra, nhưng nếu chúng ta có nhiều hơn 1 biến và một điểm có ảnh hưởng rất lớn, nhưng không phải là bất thường trong các ô 2 chiều thì sao? Không rõ ràng từ các lô dư, nhưng phần dư được học sinh sẽ cho thấy phần dư càng cực đoan hơn.