Nó đã ăn sâu vào việc giảng dạy các ngành học ứng dụng, chẳng hạn như y học, rằng các phép đo đại lượng y học sinh học trong dân số theo một "đường cong hình chuông" bình thường. Một tìm kiếm của Google về chuỗi "chúng tôi giả định phân phối bình thường" trả về kết quả ! Chúng có vẻ như, "với số lượng nhỏ các điểm dữ liệu cực đoan, chúng tôi giả định phân phối bình thường cho các dị thường nhiệt độ" trong một nghiên cứu về biến đổi khí hậu; hoặc "chúng tôi giả định một phân phối bình thường của ngày nở gà con" trên một tài liệu có thể ít gây tranh cãi hơn về chim cánh cụt; hoặc "chúng tôi giả định phân phối bình thường các cú sốc tăng trưởng GDP" ,, ... và những thứ khác).
Gần đây, tôi thấy mình đặt câu hỏi về việc xử lý dữ liệu đếm như được phân phối bình thường do tính chất tích cực nghiêm ngặt của chúng. Tất nhiên, dữ liệu đếm là rời rạc, làm cho tính quy luật của chúng trở nên giả tạo hơn. Nhưng ngay cả khi bỏ điểm cuối này sang một bên, tại sao các biện pháp thực nghiệm liên tục như cân nặng, chiều cao hoặc nồng độ glucose, được coi là nguyên mẫu "liên tục", được coi là bình thường? Họ không thể có những quan sát nhận thức tiêu cực hơn bất kỳ số lượng nào!
Tôi hiểu rằng khi độ lệch chuẩn thấp hơn đáng kể so với giá trị trung bình, chỉ ra một vài giá trị âm ("kiểm tra phạm vi 95%") có thể là một giả định thực tế và biểu đồ tần số có thể hỗ trợ nếu không quá sai lệch. Nhưng câu hỏi không có vẻ tầm thường và một cuộc tìm kiếm nhanh đã mang lại những điều thú vị.
Trong Tự nhiên, chúng ta có thể tìm thấy tuyên bố sau đây trong một bức thư của DF Heath : "Tôi muốn chỉ ra rằng để phân tích thống kê một số loại dữ liệu, giả định rằng dữ liệu được rút ra từ một dân số bình thường thường là sai và thay thế giả định phân phối log-normal là tốt hơn. Sự thay thế này được sử dụng rộng rãi bởi các nhà thống kê, nhà kinh tế và vật lý, nhưng vì một số lý do thường bị các nhà khoa học của một số ngành khác bỏ qua. "
Limpert lưu ý rằng "mô hình log-normal có thể đóng vai trò là một xấp xỉ theo nghĩa mà nhiều nhà khoa học nhận thấy bình thường là một xấp xỉ hợp lệ hiện nay" , trong khi lưu ý đến sức mạnh thấp của các thử nghiệm về tính phù hợp của tính bình thường và khó khăn trong việc lựa chọn phân phối đúng theo kinh nghiệm khi xử lý các mẫu nhỏ.
Do đó, câu hỏi đặt ra là "Khi nào có thể chấp nhận giả định phân phối bình thường của phép đo thực nghiệm trong các ngành khoa học ứng dụng mà không cần bằng chứng hỗ trợ thêm?" Và, tại sao các lựa chọn thay thế khác, chẳng hạn như log-normal, không, và có lẽ sẽ không giữ được?