Đưa ra một tập dữ liệu:
x <- c(4.9958942,5.9730174,9.8642732,11.5609671,10.1178216,6.6279774,9.2441754,9.9419299,13.4710469,6.0601435,8.2095239,7.9456672,12.7039825,7.4197810,9.5928275,8.2267352,2.8314614,11.5653497,6.0828073,11.3926117,10.5403929,14.9751607,11.7647580,8.2867261,10.0291522,7.7132033,6.3337642,14.6066222,11.3436587,11.2717791,10.8818323,8.0320657,6.7354041,9.1871676,13.4381778,7.4353197,8.9210043,10.2010750,11.9442048,11.0081195,4.3369520,13.2562675,15.9945674,8.7528248,14.4948086,14.3577443,6.7438382,9.1434984,15.4599419,13.1424011,7.0481925,7.4823108,10.5743730,6.4166006,11.8225244,8.9388744,10.3698150,10.3965596,13.5226492,16.0069239,6.1139247,11.0838351,9.1659242,7.9896031,10.7282936,14.2666492,13.6478802,10.6248561,15.3834373,11.5096033,14.5806570,10.7648690,5.3407430,7.7535042,7.1942866,9.8867927,12.7413156,10.8127809,8.1726772,8.3965665)
.. Tôi muốn xác định phân phối xác suất phù hợp nhất (gamma, beta, bình thường, hàm mũ, poisson, chi bình phương, v.v.) với ước tính của các tham số. Tôi đã biết câu hỏi trên liên kết sau, nơi giải pháp được cung cấp bằng R: /programming/2661402/given-a-set-of-random-numbers-drawn-from-a- liên tục-univariate-phân phối-f giải pháp đề xuất tốt nhất là như sau:
> library(MASS)
> fitdistr(x, 't')$loglik #$
> fitdistr(x, 'normal')$loglik #$
> fitdistr(x, 'logistic')$loglik #$
> fitdistr(x, 'weibull')$loglik #$
> fitdistr(x, 'gamma')$loglik #$
> fitdistr(x, 'lognormal')$loglik #$
> fitdistr(x, 'exponential')$loglik #$
Và phân phối với giá trị loglik nhỏ nhất được chọn. Tuy nhiên, các phân phối khác như phân phối beta yêu cầu đặc điểm kỹ thuật của một số tham số bổ sung trong hàm fitdistr ():
fitdistr(x, 'beta', list(shape1 = some value, shape2= some value)).
Cho rằng tôi đang cố gắng xác định phân phối tốt nhất mà không có bất kỳ thông tin nào trước đó, tôi không biết giá trị của các tham số có thể là bao nhiêu cho mỗi phân phối. Có một giải pháp khác đưa yêu cầu này vào tài khoản? nó không phải ở R.