Là phần dư sinh viên v / s phần dư chuẩn hóa trong mô hình lm


10

Các "số dư sinh viên" và "số dư chuẩn hóa" có giống nhau trong các mô hình hồi quy không? Tôi đã xây dựng mô hình hồi quy tuyến tính trong R và muốn vẽ đồ thị của các giá trị được trang bị cho phần dư Sinh viên v / s, nhưng không tìm thấy cách tự động để thực hiện điều này trong R.

Giả sử tôi có một mô hình

library(MASS)

lm.fit <- lm(Boston$medv~(Boston$lstat))

sau đó sử dụng plot(lm.fit)không cung cấp bất kỳ biểu đồ nào của phần dư Sinh viên so với giá trị được trang bị nhưng nó cung cấp biểu đồ phần dư Chuẩn hóa so với giá trị được trang bị.

Tôi đã sử dụng plot(lm.fit$fitted.values,studres(lm.fit)và nó sẽ vẽ đồ thị mong muốn. Vì vậy, tôi chỉ muốn xác nhận rằng tôi đang đi đúng hướng và phần dư Sinh viên và Tiêu chuẩn hóa không giống nhau. Nếu chúng khác nhau, vui lòng cung cấp một số hướng dẫn để tính toán chúng và định nghĩa của chúng. Tôi đã tìm kiếm thông qua mạng và thấy nó hơi khó hiểu.


2
1 Nó khó hiểu bởi vì (a) thực sự các loại dư khác nhau nhưng (b) cơ quan chức năng khác nhau không đồng ý về những gì để gọi cho họ! Chẳng hạn, Rthuật ngữ này trái ngược với Montgomery, Peck và Vining (một cuốn sách giáo khoa hồi quy phổ biến đã tồn tại được 35 năm). Vì vậy, hãy cẩn thận, và đảm bảo bạn nghiên cứu Rtài liệu và nếu cần mã nguồn của nó thay vì dựa vào những gì bạn nghĩ thuật ngữ này có nghĩa.
whuber

Câu trả lời:


11

Không, phần dư sinh viên và phần dư được tiêu chuẩn hóa là các khái niệm khác nhau (nhưng có liên quan).

R trong thực tế không cung cấp các hàm dựng sẵn rstandard()rstudent()như là một phần của ảnh hưởng . Gói tích hợp tương tự cung cấp nhiều chức năng tương tự cho đòn bẩy, khoảng cách của Cook, v.v ... rstudent()về cơ bản giống như MASS::studres(), mà bạn có thể tự kiểm tra như vậy:

> all.equal(MASS::studres(model), rstudent(model))
[1] TRUE

Phần dư được chuẩn hóa là cách ước tính lỗi cho một điểm dữ liệu cụ thể có tính đến đòn bẩy / ảnh hưởng của điểm. Chúng đôi khi được gọi là "phần dư sinh viên nội bộ."

rTôi= =eTôiS(eTôi)= =eTôiMSE(1-hTôiTôi)

εTôi~N(0,σ2)eTôi

Phần dư được sinh viên cho bất kỳ điểm dữ liệu đã cho nào được tính toán từ một mô hình phù hợp với mọi điểm dữ liệu khác ngoại trừ điểm được đề cập. Chúng được gọi khác nhau là "phần dư được học sinh bên ngoài", "phần dư bị xóa" hoặc "phần dư bị biến dạng".

rTôitTôi

tTôi= =rTôi(n-k-2n-k-1-rTôi2)1/2,

Động lực đằng sau số dư sinh viên đến từ việc sử dụng chúng trong các thử nghiệm ngoại lệ. Nếu chúng ta nghi ngờ một điểm là một ngoại lệ, thì theo định nghĩa, nó không được tạo ra từ mô hình giả định. Do đó, sẽ là một sai lầm - vi phạm các giả định - bao gồm điều đó ngoại lệ trong sự phù hợp của mô hình. Dư lượng sinh viên được sử dụng rộng rãi trong phát hiện ngoại lệ thực tế.

Phần dư sinh viên cũng có đặc tính mong muốn là đối với mỗi điểm dữ liệu, phân phối phần dư sẽ phân phối t của Sinh viên, giả sử các giả định quy tắc của mô hình hồi quy ban đầu đã được đáp ứng. (Phần dư được chuẩn hóa không có bản phân phối đẹp như vậy.)

Cuối cùng, để giải quyết bất kỳ mối lo ngại nào về việc thư viện R có thể tuân theo danh pháp khác với ở trên, tài liệu R nêu rõ rằng họ sử dụng "tiêu chuẩn hóa" và "học sinh" theo nghĩa chính xác được mô tả ở trên.

Chức năng rstandardrstudentcung cấp các phần dư được chuẩn hóa và Sinh viên hóa tương ứng. (Chúng bình thường hóa lại phần dư để có phương sai đơn vị, sử dụng thước đo tổng thể và loại bỏ một lần của phương sai lỗi tương ứng.)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.