Tôi muốn làm một bài kiểm tra W của Shapiro Wilk và bài kiểm tra Kolmogorov-Smirnov trên phần dư của mô hình tuyến tính để kiểm tra tính chuẩn. Tôi chỉ tự hỏi những gì còn lại nên được sử dụng cho điều này - phần dư thô, phần dư Pearson, phần dư sinh viên hoặc phần dư tiêu chuẩn? Đối với thử nghiệm W của Shapiro-Wilk, có vẻ như kết quả cho phần dư & Pearson thô là giống hệt nhau nhưng không phải cho các kết quả khác.
fit=lm(mpg ~ 1 + hp + wt, data=mtcars)
res1=residuals(fit,type="response")
res2=residuals(fit,type="pearson")
res3=rstudent(fit)
res4=rstandard(fit)
shapiro.test(res1) # W = 0.9279, p-value = 0.03427
shapiro.test(res2) # W = 0.9279, p-value = 0.03427
shapiro.test(res3) # W = 0.9058, p-value = 0.008722
shapiro.test(res4) # W = 0.9205, p-value = 0.02143
Câu hỏi tương tự cho KS và cũng là liệu phần dư có nên được kiểm tra đối với phân phối bình thường (pnorm) như trong
ks.test(res1, "pnorm") # D = 0.296, p-value = 0.005563
hoặc phân phối t-student với nk-2 bậc tự do, như trong
ks.test(res3, "pt",df=nrow(mtcars)-2-2)
Có lời khuyên nào không? Ngoài ra, các giá trị được đề xuất cho thống kê kiểm tra W (> 0,9?) Và D là gì để phân phối đủ gần với quy tắc và không ảnh hưởng quá nhiều đến suy luận của bạn?
Cuối cùng, cách tiếp cận này có tính đến sự không chắc chắn trong các hệ số lm được trang bị, hoặc chức năng cumres()
trong gói gof()
sẽ tốt hơn về mặt này?
chúc mừng, Tom