Tại sao bạn phải kiểm tra tính bình thường?
Giả định tiêu chuẩn trong hồi quy tuyến tính là phần dư lý thuyết là độc lập và phân phối bình thường. Phần dư quan sát được là ước tính của phần dư lý thuyết, nhưng không độc lập (có các biến đổi trên phần dư loại bỏ một số phần phụ thuộc, nhưng vẫn chỉ đưa ra xấp xỉ phần dư thực). Vì vậy, một thử nghiệm trên phần dư quan sát không đảm bảo rằng phần dư lý thuyết phù hợp.
Nếu phần dư lý thuyết không được phân phối chính xác thông thường, nhưng cỡ mẫu đủ lớn thì Định lý giới hạn trung tâm nói rằng suy luận thông thường (các phép thử và khoảng tin cậy, nhưng không nhất thiết là các khoảng dự đoán) dựa trên giả định về tính chuẩn .
Cũng lưu ý rằng các bài kiểm tra về tính quy tắc là các bài kiểm tra loại trừ, chúng có thể cho bạn biết rằng dữ liệu không có khả năng đến từ một bản phân phối bình thường. Nhưng nếu thử nghiệm không đáng kể, điều đó không có nghĩa là dữ liệu đến từ phân phối bình thường, điều đó cũng có nghĩa là bạn không có đủ sức mạnh để thấy sự khác biệt. Kích thước mẫu lớn hơn cung cấp nhiều năng lượng hơn để phát hiện tính phi quy tắc, nhưng các mẫu lớn hơn và CLT có nghĩa là tính phi quy tắc là ít quan trọng nhất. Vì vậy, đối với các cỡ mẫu nhỏ, giả định về tính chuẩn là quan trọng nhưng các phép thử là vô nghĩa, đối với các cỡ mẫu lớn, các phép thử có thể chính xác hơn, nhưng câu hỏi về tính chuẩn tắc chính xác trở nên vô nghĩa.
Vì vậy, kết hợp tất cả những điều trên, điều quan trọng hơn một bài kiểm tra về tính quy phạm chính xác là sự hiểu biết về khoa học đằng sau dữ liệu để xem liệu dân số có đủ gần với bình thường hay không. Các biểu đồ như qqplots có thể là chẩn đoán tốt, nhưng cũng cần có sự hiểu biết về khoa học. Nếu có lo ngại rằng có quá nhiều sai lệch hoặc tiềm năng cho các ngoại lệ, thì các phương pháp không tham số có sẵn mà không yêu cầu giả định quy tắc.