Giả sử tôi đang tính chiều cao (tính bằng cm) và các số phải cao hơn 0.
Dưới đây là danh sách mẫu:
0.77132064
0.02075195
0.63364823
0.74880388
0.49850701
0.22479665
0.19806286
0.76053071
0.16911084
0.08833981
Mean: 0.41138725956196015
Std: 0.2860541519582141
Trong ví dụ này, theo phân phối chuẩn, 99,7% giá trị phải nằm trong khoảng từ 3 lần độ lệch chuẩn so với giá trị trung bình. Tuy nhiên, thậm chí gấp đôi độ lệch chuẩn trở thành âm:
-2 x std calculation = 0.41138725956196015 - 0.2860541519582141 x 2 = -0,160721044354468
Tuy nhiên, số của tôi phải tích cực. Vì vậy, chúng phải ở trên 0. Tôi có thể bỏ qua các số âm nhưng tôi nghi ngờ đây là cách chính xác để tính xác suất sử dụng độ lệch chuẩn.
Ai đó có thể giúp tôi hiểu nếu tôi đang sử dụng điều này một cách chính xác? Hay tôi cần chọn một phương pháp khác?
Thành thật mà nói, toán học là toán học. Nó không quan trọng nếu nó là phân phối bình thường hay không. Nếu nó hoạt động với số không dấu, nó cũng hoạt động với số dương! Tôi có lầm không?
EDIT1: Đã thêm biểu đồ
Để rõ ràng hơn, tôi đã thêm biểu đồ dữ liệu thực của mình
EDIT2: Một số giá trị
Mean: 0.007041500928135767
Percentile 50: 0.0052000000000000934
Percentile 90: 0.015500000000000047
Std: 0.0063790857035425025
Var: 4.06873389299246e-05