Việc phân phối dữ liệu của bạn không cần phải bình thường, đó là Phân phối lấy mẫu phải gần như bình thường. Nếu cỡ mẫu của bạn đủ lớn, thì phân phối mẫu của phương tiện từ Phân phối Landau phải gần như bình thường, do Định lý giới hạn trung tâm .
Vì vậy, điều đó có nghĩa là bạn sẽ có thể sử dụng t-test một cách an toàn với dữ liệu của mình.
Thí dụ
Hãy xem xét ví dụ này: giả sử chúng ta có một quần thể có phân phối Lognatural với mu = 0 và sd = 0,5 (có vẻ hơi giống với Landau)

Vì vậy, chúng tôi lấy mẫu 30 quan sát 5000 lần từ phân phối này mỗi lần tính giá trị trung bình của mẫu
Và đây là những gì chúng ta nhận được

Trông khá bình thường phải không? Nếu chúng ta tăng kích thước mẫu, nó thậm chí còn rõ ràng hơn

Mã R
x = seq(0, 4, 0.05)
y = dlnorm(x, mean=0, sd=0.5)
plot(x, y, type='l', bty='n')
n = 30
m = 1000
set.seed(0)
samp = rep(NA, m)
for (i in 1:m) {
samp[i] = mean(rlnorm(n, mean=0, sd=0.5))
}
hist(samp, col='orange', probability=T, breaks=25, main='sample size = 30')
x = seq(0.5, 1.5, 0.01)
lines(x, dnorm(x, mean=mean(samp), sd=sd(samp)))
n = 300
samp = rep(NA, m)
for (i in 1:m) {
samp[i] = mean(rlnorm(n, mean=0, sd=0.5))
}
hist(samp, col='orange', probability=T, breaks=25, main='sample size = 300')
x = seq(1, 1.25, 0.005)
lines(x, dnorm(x, mean=mean(samp), sd=sd(samp)))