Có phải là trong phương sai tiêu chuẩn hóa được biết đến trong khi học sinh không được biết và do đó ước tính? Cảm ơn bạn.
Có phải là trong phương sai tiêu chuẩn hóa được biết đến trong khi học sinh không được biết và do đó ước tính? Cảm ơn bạn.
Câu trả lời:
Một bản tóm tắt ngắn. Với một mô hình , nơi X là n × p , β = ( X ' X ) - 1 X ' y và y = X β = X ( X ' X ) - 1 X ' y = H y , trong đó H = X ( X ′ X là "ma trận mũ". Dư là e = y - y = y - H y = ( I - H ) y Phương sai dân σ 2 là không rõ và có thể được ước tính bởi M S E , sai số bình phương trung bình.
Dư Semistudentized được định nghĩa là nhưng, vì sự thay đổi của dư phụ thuộc vào cảσ2vàX, sai được ước lượng của họ là:V(ei)=MSE(1-hii) nơihiilàith yếu tố chéo của ma trận mũ.
Phần dư được chuẩn hóa , còn được gọi là phần dư sinh viên nội bộ , là:
Tuy nhiên các đơn và M S E là không độc lập, vì vậy r i không thể có một t phân phối. Thủ tục là sau đó để xóa các i th quan sát, phù hợp với chức năng hồi quy để còn lại n - 1 quan sát, và nhận được mới y 's có thể được biểu hiện bằng y i ( i ) . Sự khác biệt: d i = y i - y i ( i ) được gọi là
Xem Kutner và cộng sự, Các mô hình thống kê tuyến tính ứng dụng , Chương 10.
Chỉnh sửa: Tôi phải nói rằng câu trả lời của rpierce là hoàn hảo. Tôi nghĩ rằng OP là về phần dư được chuẩn hóa và học sinh (và chia cho độ lệch chuẩn dân số để có phần dư được tiêu chuẩn hóa đối với tôi, tất nhiên), nhưng tôi đã sai. Tôi hy vọng rằng câu trả lời của tôi có thể giúp được ai đó ngay cả khi OT.
Tuy nhiên, có vẻ như có một số khác biệt về thuật ngữ giữa các lĩnh vực (vui lòng xem các nhận xét về câu trả lời này). Do đó, người ta phải tiến hành thận trọng trong việc tạo ra những sự khác biệt này. Hơn nữa, điểm số học sinh hiếm khi được gọi như vậy và người ta thường thấy các giá trị 'được học sinh' trong bối cảnh hồi quy. @Sergio cung cấp chi tiết về những loại dư lượng đã xóa trong học sinh trong câu trả lời của anh ấy.
Tôi rất muộn khi trả lời câu hỏi này !! Nhưng không thể tìm thấy câu trả lời bằng ngôn ngữ rất đơn giản nên cố gắng trả lời một cách khiêm tốn.
Tại sao chúng ta làm tiêu chuẩn hóa? Hãy tưởng tượng bạn có hai mô hình - một mô hình dự đoán sự điên rồ từ lượng thời gian dành cho việc nghiên cứu thống kê trong khi các dự đoán khác ghi lại (craziness) với lượng thời gian cho thống kê.
thật khó để hiểu phần dư là cả hai đều ở các đơn vị khác nhau. Vì vậy, chúng tôi tiêu chuẩn hóa chúng. (Lý thuyết tương tự như điểm Z)
Dư lượng chuẩn: - Khi phần dư được chia cho ước tính độ lệch chuẩn. Nói chung nếu giá trị tuyệt đối> 3 thì đó là nguyên nhân gây lo ngại.
Chúng tôi sử dụng điều này để điều tra các ngoại lệ trong mô hình.
Studentized Residual: Chúng tôi sử dụng điều này để nghiên cứu sự ổn định của mô hình.
Quy trình rất đơn giản. Chúng tôi loại bỏ trường hợp thử nghiệm riêng lẻ khỏi mô hình và tìm ra giá trị dự đoán mới. Sự khác biệt giữa giá trị mới và giá trị quan sát ban đầu có thể được tiêu chuẩn hóa bằng cách chia sai số chuẩn. giá trị này là Sinh viên dư
Để biết thêm thông tin khám phá sử dụng R - http://www.statistichell.com/html/dsur.html
Wikipedia có một cái nhìn tổng quan tốt tại https://en.wikipedia.org/wiki/N normalization_(statistic) :
Điểm chuẩn : Bình thường hóa lỗi khi biết các thông số dân số. Hoạt động tốt cho các quần thể thường được phân phối
Thống kê của sinh viên : Bình thường hóa phần dư khi các tham số dân số không xác định (ước tính).