Sự khác biệt giữa tiêu chuẩn hóa và sinh viên là gì?


21

Có phải là trong phương sai tiêu chuẩn hóa được biết đến trong khi học sinh không được biết và do đó ước tính? Cảm ơn bạn.


2
Bạn có thể muốn làm rõ bối cảnh câu hỏi của bạn. Những loại tiêu chuẩn hóa, những loại sinh viên? Những giá trị này đang được sử dụng để làm gì?
russellpierce

3
Nếu bạn đang hỏi về số , thì thuật ngữ này không được chuẩn hóa (ahem) . Các tác giả khác nhau sử dụng các tên khác nhau cho cùng một thứ, và đôi khi - và đáng buồn nhất là, cùng một tên cho những thứ khác nhau. Có những gì tôi gọi (i) phần dư tỷ lệ ( , được gọi là phần dư được chuẩn hóa bởi một số tác giả); (ii) số dư sinh viên nội bộ (được gọi là tiêu chuẩn hóa bởi một số tác giả / gói, được sinh viên bởi những người khác); (iii) phần dư bị xóa / học sinh bên ngoài(yy^i)/s
Glen_b -Reinstate Monica

Câu trả lời:


20

Một bản tóm tắt ngắn. Với một mô hình , nơi Xn × p , β = ( X ' X ) - 1 X ' yy = X β = X ( X ' X ) - 1 X ' y = H y , trong đó H = X ( X Xy=Xβ+εXn×pβ^= =(X'X)-1X'yy^= =Xβ^= =X(X'X)-1X'y= =Hy là "ma trận mũ". Dư là e = y - y = y - H y = ( I - H ) y Phương sai dân σ 2 là không rõ và có thể được ước tính bởi M S E , sai số bình phương trung bình.H= =X(X'X)-1X'

e= =y-y^= =y-Hy= =(tôi-H)y
σ2MSE

Dư Semistudentized được định nghĩa là nhưng, vì sự thay đổi của dư phụ thuộc vào cảσ2X, sai được ước lượng của họ là:V(ei)=MSE(1-hii) nơihiiith yếu tố chéo của ma trận mũ.

etôi*= =etôiMSE
σ2X
V^(etôi)= =MSE(1-htôitôi)
htôitôitôi

Phần dư được chuẩn hóa , còn được gọi là phần dư sinh viên nội bộ , là:

rtôi= =etôiMSE(1-htôitôi)

Tuy nhiên các đơn M S E là không độc lập, vì vậy r i không thể có một t phân phối. Thủ tục là sau đó để xóa các i th quan sát, phù hợp với chức năng hồi quy để còn lại n - 1 quan sát, và nhận được mới y 's có thể được biểu hiện bằng y i ( i ) . Sự khác biệt: d i = y i - y i ( i ) được gọi làetôiMSErtôittôin-1y^y^tôi(tôi)

dtôi= =ytôi-y^tôi(tôi)
xóa dư . Một biểu thức tương đương không yêu cầu tính toán lại là: thịXMSE mớibằngX(i)MSE(i), vì chúng không phụ thuộc vàoquan sát thứi, chúng tôi nhận được: ti=di
di=ei1hii
XMSEX(i)MSE(i)i Cácti's là gọistudentized(xóa), hoặcdư bên ngoài studentized.
ttôi= =dtôiMSE(tôi)1-htôitôi= =etôiMSE(tôi)(1-htôitôi)~tn-p-1
ttôi

Xem Kutner và cộng sự, Các mô hình thống kê tuyến tính ứng dụng , Chương 10.

Chỉnh sửa: Tôi phải nói rằng câu trả lời của rpierce là hoàn hảo. Tôi nghĩ rằng OP là về phần dư được chuẩn hóa và học sinh (và chia cho độ lệch chuẩn dân số để có phần dư được tiêu chuẩn hóa đối với tôi, tất nhiên), nhưng tôi đã sai. Tôi hy vọng rằng câu trả lời của tôi có thể giúp được ai đó ngay cả khi OT.


2
... Và câu trả lời này là chính xác trong việc xác định số dư sinh viên từ phương trình hồi quy. Không có định nghĩa về phần dư chuẩn hóa tương ứng. Khung hồi quy dường như không áp dụng cho câu hỏi được hỏi. Nhưng đây vẫn là một đóng góp có giá trị; +1
russellpierce

2
@rpierce, bạn đã đúng: ngay khi tôi đọc "sinh viên" tôi cũng đọc "phần dư", nhưng chúng chỉ ở trong tâm trí của tôi ;-) Xin lỗi. Tôi đã nhận thấy sự giám sát của tôi chỉ sau lần nhấp cuối cùng.
Sergio

9

Sσ

Tuy nhiên, có vẻ như có một số khác biệt về thuật ngữ giữa các lĩnh vực (vui lòng xem các nhận xét về câu trả lời này). Do đó, người ta phải tiến hành thận trọng trong việc tạo ra những sự khác biệt này. Hơn nữa, điểm số học sinh hiếm khi được gọi như vậy và người ta thường thấy các giá trị 'được học sinh' trong bối cảnh hồi quy. @Sergio cung cấp chi tiết về những loại dư lượng đã xóa trong học sinh trong câu trả lời của anh ấy.


2
Wikipedia cho biết thêm, "Thuật ngữ này cũng được sử dụng để tiêu chuẩn hóa một thống kê mức độ cao hơn bởi một thống kê khác có cùng mức độ: ví dụ, ước tính thời điểm trung tâm thứ ba sẽ được chuẩn hóa bằng cách chia cho khối lập phương của độ lệch chuẩn mẫu. "
Nick Stauner

2
Tôi nghĩ sẽ an toàn hơn khi nói rằng Studentization là hình thức tiêu chuẩn hóa có sẵn nếu phương sai dân số không được biết đến. Điều này có hình thức của một điểm kỹ thuật, thuật ngữ phân biệt hơn là một tuyên bố sai lệch về thuật ngữ chung hơn, được sử dụng rộng rãi.
Nick Stauner

2
@whuber: Bối cảnh của câu hỏi là cơ bản, vì vậy tôi đã đưa ra một câu trả lời cơ bản. Điểm chuẩn (Z) được tính trong các số liệu thống kê giới thiệu vàσđược trao cho họ. Đôi khi bạn thực sự có độ lệch chuẩn dân số (ví dụ: tổng điều tra dữ liệu không thiếu của 10 người).
russellpierce

2
@Nick Nghe có vẻ như là một giải pháp tốt, do các cơ quan khác nhau sử dụng "tiêu chuẩn hóa" một cách rộng rãi nhưng không ai (AFAIK) từng sử dụng "sinh viên hóa" theo nghĩa rộng như vậy.
whuber

2
@rpierce Cuốn sách thứ hai (Freedman, Pisani và Purves) đã tồn tại khoảng 40 năm, qua năm phiên bản (phần lớn không thay đổi), và bắt đầu cuộc sống như văn bản cho khóa học thống kê giới thiệu của UC Berkeley. Nó chỉ bao gồm tất cả các lĩnh vực có thể hiểu được, không chỉ sức khỏe cộng đồng. Mặt khác, một trong những điểm mạnh của nó là tránh nhấn mạnh những khác biệt nhỏ, vô nghĩa hoặc quá kỹ thuật, vì vậy mặc dù đó là một hướng dẫn tốt để thống kê nói chung, nhưng không thể dựa vào việc giải quyết các vấn đề phức tạp.
whuber

3

Tôi rất muộn khi trả lời câu hỏi này !! Nhưng không thể tìm thấy câu trả lời bằng ngôn ngữ rất đơn giản nên cố gắng trả lời một cách khiêm tốn.

Tại sao chúng ta làm tiêu chuẩn hóa? Hãy tưởng tượng bạn có hai mô hình - một mô hình dự đoán sự điên rồ từ lượng thời gian dành cho việc nghiên cứu thống kê trong khi các dự đoán khác ghi lại (craziness) với lượng thời gian cho thống kê.

thật khó để hiểu phần dư là cả hai đều ở các đơn vị khác nhau. Vì vậy, chúng tôi tiêu chuẩn hóa chúng. (Lý thuyết tương tự như điểm Z)

Dư lượng chuẩn: - Khi phần dư được chia cho ước tính độ lệch chuẩn. Nói chung nếu giá trị tuyệt đối> 3 thì đó là nguyên nhân gây lo ngại.

Chúng tôi sử dụng điều này để điều tra các ngoại lệ trong mô hình.

Studentized Residual: Chúng tôi sử dụng điều này để nghiên cứu sự ổn định của mô hình.

Quy trình rất đơn giản. Chúng tôi loại bỏ trường hợp thử nghiệm riêng lẻ khỏi mô hình và tìm ra giá trị dự đoán mới. Sự khác biệt giữa giá trị mới và giá trị quan sát ban đầu có thể được tiêu chuẩn hóa bằng cách chia sai số chuẩn. giá trị này là Sinh viên dư

Để biết thêm thông tin khám phá sử dụng R - http://www.statistichell.com/html/dsur.html


1

Wikipedia có một cái nhìn tổng quan tốt tại https://en.wikipedia.org/wiki/N normalization_(statistic) :

Điểm chuẩn X-μσ: Bình thường hóa lỗi khi biết các thông số dân số. Hoạt động tốt cho các quần thể thường được phân phối

Thống kê của sinh viên X-X¯S : Bình thường hóa phần dư khi các tham số dân số không xác định (ước tính).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.