Thay vì dựa vào một bài kiểm tra về tính bình thường của phần dư, hãy thử đánh giá tính chuẩn bằng phán đoán hợp lý. Các xét nghiệm thông thường không cho bạn biết rằng dữ liệu của bạn là bình thường, chỉ có điều là không. Nhưng cho rằng dữ liệu là một mẫu bạn có thể khá chắc chắn rằng chúng không thực sự bình thường nếu không có thử nghiệm. Yêu cầu là xấp xỉ bình thường. Bài kiểm tra không thể cho bạn biết điều đó. Các xét nghiệm cũng rất nhạy cảm ở N lớn hoặc nghiêm trọng hơn, độ nhạy khác nhau với N. N của bạn nằm trong phạm vi mà độ nhạy bắt đầu tăng cao. Nếu bạn chạy mô phỏng sau trong R một số lần và nhìn vào các ô thì bạn sẽ thấy rằng kiểm tra tính quy tắc đang nói "không bình thường" trên một số lượng lớn các bản phân phối bình thường.
# set the plot area to show two plots side by side (make the window wide)
par(mfrow = c(1, 2))
n <- 158 # use the N we're concerned about
# Run this a few times to get an idea of what data from a
# normal distribution should look like.
# especially note how variable the histograms look
y <- rnorm(n) # n numbers from normal distribution
# view the distribution
hist(y)
qqnorm(y);qqline(y)
# run this section several times to get an idea what data from a normal
# distribution that fails the normality test looks like
# the following code block generates random normal distributions until one
# fails a normality test
p <- 1 # set p to a dummy value to start with
while(p >= 0.05) {
y <- rnorm(n)
p <- shapiro.test(y)$p.value }
# view the distribution that failed
hist(y)
qqnorm(y);qqline(y)
Hy vọng rằng, sau khi trải qua các mô phỏng, bạn có thể thấy rằng một bài kiểm tra tính quy tắc có thể dễ dàng từ chối dữ liệu trông khá bình thường và dữ liệu từ một bản phân phối bình thường có thể trông khá xa so với bình thường. Nếu bạn muốn thấy một giá trị cực đoan của thử đó n <- 1000
. Tất cả các bản phân phối sẽ trông bình thường nhưng vẫn thất bại trong thử nghiệm với cùng tốc độ với giá trị N thấp hơn. Và ngược lại, với phân phối N thấp vượt qua bài kiểm tra có thể trông rất xa so với bình thường.
Biểu đồ dư chuẩn trong SPSS không hữu ích lắm để đánh giá tính chuẩn. Bạn có thể thấy các ngoại lệ, phạm vi, mức độ phù hợp và thậm chí có thể là đòn bẩy. Nhưng sự bình thường rất khó để bắt nguồn từ nó. Hãy thử mô phỏng sau đây so sánh biểu đồ, các ô bình thường lượng tử - lượng tử và các ô dư.
par(mfrow = c(1, 3)) # making 3 graphs in a row now
y <- rnorm(n)
hist(y)
qqnorm(y); qqline(y)
plot(y); abline(h = 0)
Thật khó để nói sự bình thường, hoặc bất cứ điều gì, từ cốt truyện cuối cùng và do đó không phải là chẩn đoán quá mức về tính quy phạm.
Tóm lại, thông thường không nên dựa vào các xét nghiệm thông thường mà là các sơ đồ chẩn đoán của phần dư. Không có những âm mưu hoặc giá trị thực tế trong câu hỏi của bạn, rất khó để ai có thể cho bạn lời khuyên chắc chắn về những gì dữ liệu của bạn cần về mặt phân tích hoặc chuyển đổi. Để có được sự giúp đỡ tốt nhất, hãy cung cấp dữ liệu thô.