Chúng tôi đã thực hiện một số loại thử nghiệm giả thuyết thống kê, một trong số đó là thử nghiệm mô hình phù hợp chi bình phương - một thử nghiệm chi bình phương về số lượng mẫu trong các thùng được xác định từ CDF nghịch đảo của phân phối xác suất đã cho. Vì vậy, ví dụ, để kiểm tra việc tạo mẫu phân phối Cauchy, tôi chạy một cái gì đó như
with(Statistics):
infolevel[Statistics] := 1:
distribution := CauchyDistribution(2, 3):
sample := Sample(distribution, 10^6):
ChiSquareSuitableModelTest(sample, distribution, 'bins' = 100, 'level' = 0.001);
α
Đối với các bản phân phối có các khoảnh khắc hữu hạn, tôi tính toán một mặt một số khoảnh khắc mẫu và mặt khác, tôi tính toán một cách tượng trưng các khoảnh khắc phân phối tương ứng và sai số chuẩn của chúng. Vì vậy, ví dụ như bản phân phối beta:
with(Statistics):
distribution := BetaDistribution(2, 3):
distributionMoments := Moment~(distribution, [seq(1 .. 10)]);
standardErrors := StandardError[10^6]~(Moment, distribution, [seq(1..10)]);
evalf(distributionMoments /~ standardErrors);
106
with(Statistics):
sample := Sample(BetaDistribution(2, 3), 10^6):
sampleMoments := map2(Moment, sample, [seq(1 .. 10)]);
distributionMoments := [2/5, 1/5, 4/35, 1/14, 1/21, 1/30, 4/165, 1/55, 2/143, 1/91];
standardErrors :=
[1/5000, 1/70000*154^(1/2), 1/210000*894^(1/2), 1/770000*7755^(1/2),
1/54600*26^(1/2), 1/210000*266^(1/2), 7/5610000*2771^(1/2),
1/1567500*7809^(1/2), 3/5005000*6685^(1/2), 1/9209200*157366^(1/2)];
deviations := abs~(sampleMoments - distributionMoments) /~ standardErrors;
Các số trong distributionMoments
và standardErrors
đến từ lần chạy đầu tiên ở trên. Bây giờ nếu thế hệ mẫu là chính xác, các số trong độ lệch sẽ tương đối nhỏ. Tôi giả sử rằng chúng được phân phối gần như bình thường (mà chúng không thực sự, nhưng nó đủ gần - nhớ lại đây là các phiên bản thu nhỏ của các khoảnh khắc mẫu, chứ không phải bản thân các mẫu) và do đó, tôi có thể đánh dấu một trường hợp có độ lệch lớn hơn 4 - tương ứng với một khoảnh khắc mẫu sai lệch hơn bốn lần so với sai số chuẩn so với thời điểm phân phối. Điều này rất khó xảy ra ngẫu nhiên nếu thế hệ mẫu tốt. Mặt khác, nếu 10 khoảnh khắc mẫu đầu tiên khớp với các khoảnh khắc phân phối trong phạm vi dưới nửa phần trăm, thì chúng ta có một xấp xỉ khá tốt về phân phối.