Trong R, tại sao các cài đặt mặc định qqplot(linear model)
sử dụng phần dư được chuẩn hóa trên trục y? Tại sao R không sử dụng phần dư "thông thường"?
Trong R, tại sao các cài đặt mặc định qqplot(linear model)
sử dụng phần dư được chuẩn hóa trên trục y? Tại sao R không sử dụng phần dư "thông thường"?
Câu trả lời:
Khi bạn sử dụng phần dư được chuẩn hóa, giá trị dự kiến của phần dư là 0 và phương sai là (xấp xỉ) một. Điều này có hai lợi ích:
y = x
Phần dư lý thuyết trong một mô hình tuyến tính được phân phối độc lập bình thường. Tuy nhiên, phần dư quan sát được không độc lập và không có phương sai bằng nhau. Vì vậy, tiêu chuẩn hóa phần dư chia cho độ lệch chuẩn ước tính liên quan đến phần dư đó làm cho chúng bằng nhau hơn trong phương sai của chúng (sử dụng thông tin từ ma trận mũ để tính toán điều này). Đây là một phần còn lại có ý nghĩa hơn để xem xét trong qqplot.
Ngoài ra, bạn có thực sự chạy qqplot trên mô hình được trang bị? hoặc đây là qqplot từ chạy cốt truyện trên mô hình?