Bài đăng gốc bỏ lỡ một vài điểm chính: (1) Không có "dữ liệu" nào có thể được phân phối bình thường. Dữ liệu nhất thiết phải rời rạc. Câu hỏi hợp lệ là "quy trình tạo ra dữ liệu có phải là quy trình phân phối bình thường không?" Nhưng (2) câu trả lời cho câu hỏi thứ hai luôn là "không", bất kể mọi kiểm tra thống kê hoặc đánh giá khác dựa trên dữ liệu mang lại cho bạn là gì. Thông thường các quy trình phân tán tạo ra dữ liệu với tính liên tục vô hạn, tính đối xứng hoàn hảo và xác suất được chỉ định chính xác trong phạm vi độ lệch chuẩn (ví dụ: 68-95-99.7), không có điều nào đúng với các quy trình làm phát sinh dữ liệu mà chúng ta có thể đo được bằng bất cứ điều gì thiết bị đo lường mà con người chúng ta có thể sử dụng.
Vì vậy, bạn không bao giờ có thể coi dữ liệu được phân phối bình thường và bạn không bao giờ có thể coi quy trình tạo ra dữ liệu là một quy trình được phân phối chính xác thông thường. Nhưng, như Glen_b đã chỉ ra, nó có thể không quá quan trọng, tùy thuộc vào việc bạn đang cố gắng làm gì với dữ liệu.
Thống kê Skewness và kurtosis có thể giúp bạn đánh giá một số loại sai lệch so với tính quy tắc của quy trình tạo dữ liệu của bạn. Họ là thống kê rất thay đổi, mặc dù. Các lỗi tiêu chuẩn được đưa ra ở trên không hữu ích vì chúng chỉ có giá trị theo quy tắc, có nghĩa là chúng chỉ hữu ích khi kiểm tra tính quy tắc, một bài tập cơ bản vô dụng. Sẽ tốt hơn nếu sử dụng bootstrap để tìm se, mặc dù các mẫu lớn sẽ là cần thiết để có được se chính xác.
Ngoài ra, kurtosis rất dễ giải thích, trái với bài viết trên. Nó là giá trị trung bình (hoặc giá trị mong đợi) của các giá trị Z, mỗi giá trị được đưa đến công suất thứ tư. Lớn | Z | các giá trị là ngoại lệ và đóng góp rất nhiều vào kurtosis. Nhỏ | Z | các giá trị, trong đó "đỉnh" của phân phối là, cung cấp cho Z ^ 4 giá trị rất nhỏ và về cơ bản không đóng góp gì cho sự suy yếu. Tôi đã chứng minh trong bài viết của mình https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/ rằng kurtosis được xấp xỉ rất tốt bởi giá trị trung bình của các giá trị Z ^ 4 * I (| Z |> 1). Do đó, kurtosis đo lường xu hướng của quá trình tạo dữ liệu để tạo ra các ngoại lệ.