Dư lượng thô so với dư lượng chuẩn hóa so với dư lượng sinh viên - sử dụng khi nào?


31

Đây có vẻ là một câu hỏi tương tự và không nhận được nhiều câu trả lời.

Bỏ qua các bài kiểm tra như Cook's D và chỉ xem các nhóm dư, tôi quan tâm đến cách người khác sử dụng số dư khi đánh giá mức độ phù hợp. Tôi sử dụng phần còn lại thô:

  1. trong một âm mưu QQ, để đánh giá tính bình thường
  2. trong một biểu đồ tán xạ của so với phần dư, để kiểm tra nhãn cầu của (a) hetereoscedasticity và (b) autocorrelation nối tiếp.y

Đối với âm mưu so với phần dư để kiểm tra các giá trị cho y nơi có thể xảy ra ngoại lệ, tôi thích sử dụng phần dư được học sinh . Lý do cho sở thích của tôi là nó cho phép dễ dàng xem phần dư nào mà giá trị y có vấn đề, mặc dù phần dư được chuẩn hóa cung cấp một kết quả cực kỳ giống nhau. Lý thuyết của tôi về việc được sử dụng là nó phụ thuộc vào trường đại học nào.yyy

Điều này có giống với cách người khác sử dụng dư không? Những người khác có sử dụng số biểu đồ này kết hợp với thống kê tóm tắt không?


3
Dư lượng sinh viên chắc chắn tốt hơn trong việc phát hiện các ngoại lệ, và, có thể, tốt hơn một chút trong kiểm tra độ không đồng nhất. Đối với các mục đích khác, nó không có gì khác biệt đối với tôi những gì còn lại để sử dụng.
ttnphns

Để gây chú ý cho một câu hỏi, Michelle hoặc yêu cầu thay đổi trạng thái của nó (chẳng hạn như CW), vui lòng theo liên kết "cờ" bên dưới câu hỏi. Điều này sẽ tự động thông báo cho tất cả người điều hành. Việc nhúng các yêu cầu trong các câu hỏi, nhận xét hoặc trả lời là trúng hoặc bỏ lỡ vì nó phụ thuộc vào hy vọng người điều hành (hoặc người dùng có tính đại diện cao khác) sẽ thực sự đọc nó trong một thời gian hợp lý!
whuber

@whuber Ah, xem tôi đã nghĩ rằng một trong số các bạn cuối cùng sẽ đọc nó. :) Cảm ơn các mẹo về việc sử dụng cờ.
Michelle

1
Xin chào @ttnphns Tại sao họ sẽ tốt hơn? Cụ thể, tại sao học sinh sẽ tốt hơn so với tiêu chuẩn? (Tôi chưa bao giờ thực sự biết câu trả lời ở đây)
Peter Flom - Tái lập Monica

4
@Peter, phần dư sinh viên ít bị "bóp méo" hơn bởi thuật toán phù hợp OLS và gần với khái niệm lý thuyết về "lỗi" . Chúng có thể được so sánh trực tiếp tại các khu vực khác nhau của dòng phù hợp, từ đó quyết định tốt hơn nếu một điểm là một ngoại lệ.
ttnphns

Câu trả lời:


8

Đây không phải là một câu trả lời như là một sự làm rõ về thuật ngữ. Câu hỏi của bạn hỏi về phần dư, thô và học sinh. Tuy nhiên, đây không phải là thuật ngữ được sử dụng bởi hầu hết các nhà thống kê, mặc dù tôi lưu ý rằng lớp học của bạn ghi chú rằng nó là.

Nguyên: giống như bạn có nó.

Tiêu chuẩn hóa: đây thực sự là phần dư thô chia cho độ lệch chuẩn thực của phần dư. Vì độ lệch chuẩn thực sự hiếm khi được biết đến, phần dư chuẩn hóa gần như không bao giờ được sử dụng.

Sinh viên nội bộ: vì độ lệch chuẩn thực sự của phần dư thường không được biết đến, nên độ lệch chuẩn ước tính được sử dụng thay thế. Đây là phần dư sinh viên xen kẽ, và đó là những gì bạn gọi là tiêu chuẩn hóa.

Sinh viên bên ngoài: giống như phần dư sinh viên nội bộ, ngoại trừ việc ước tính độ lệch chuẩn của phần dư được tính từ hồi quy bỏ qua quan sát trong câu hỏi.

Pearson: phần dư thô chia cho độ lệch chuẩn của biến trả lời (biến y) thay vì phần dư. Bạn không có cái này được liệt kê.

"bỏ một cái ra": Không có tên chính thức, nhưng nó giống như các ghi chú lớp.

standarized "rời khỏi một": cũng không có tên chính thức, nhưng đây không phải là điều mà các ghi chú trong lớp gọi là học sinh.

Nguồn:

  1. cùng một liên kết wiki mà bạn có về phần dư được học sinh ("phần dư được học sinh là thương số do việc chia phần dư theo ước tính độ lệch chuẩn của nó")

  2. tài liệu tính toán còn lại trong SAS


2
+1 Chắc chắn một số nhà thống kê đã sử dụng các thuật ngữ trong câu hỏi của OP (và không phải lúc nào cũng hoàn toàn nhất quán với những người khác sử dụng cùng một từ). Tôi nghĩ rằng các thuật ngữ bạn sử dụng đang trở nên phổ biến hơn nhưng tôi không chắc dựa trên cơ sở nào chúng ta có thể đoán được về cách sử dụng tương đối trên toàn thế giới giữa các nhà thống kê - ví dụ, các bài báo không nhất thiết phải giúp vì nhà thống kê trung bình sẽ không chủ động xuất bản. Bạn có thể đúng - nhưng làm sao chúng ta biết? [Nếu bạn
tình cờ

2

Re: lô,

Có một thứ như là quá mức, nhưng quá mức có thể thực sự gây hại nhiều, đặc biệt là ở giai đoạn chẩn đoán. Một âm mưu xác suất chuẩn được tiêu chuẩn hóa có thể bị tổn thương bên cạnh âm mưu QQ của bạn. Tôi thấy tốt hơn để đánh giá giữa phân phối.

Re: dư,

Tôi chạy cả phần dư được chuẩn hóa và học sinh ở giai đoạn dự thảo và thường kết thúc bằng mã hóa những phần chuẩn. Tôi không biết những gì người khác thực sự chạy, bởi vì chẩn đoán thực sự được mã hóa trong tài liệu sao chép mà tôi tìm thấy trên mạng.

Re: chẩn đoán,

vifhettestR2

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.