Những điều cần lo lắng bao gồm:
Kích thước của tập dữ liệu. Nó không nhỏ xíu, không lớn.
Sự phụ thuộc của những gì bạn nhìn thấy vào nguồn gốc biểu đồ và chiều rộng thùng. Chỉ có một sự lựa chọn rõ ràng, bạn (và chúng tôi) không có ý tưởng về sự nhạy cảm.
Sự phụ thuộc của những gì bạn thấy vào loại nhân và chiều rộng và bất kỳ lựa chọn nào khác được thực hiện cho bạn trong ước tính mật độ. Chỉ có một sự lựa chọn rõ ràng, bạn (và chúng tôi) không có ý tưởng về sự nhạy cảm.
Ở những nơi khác tôi đã đề nghị một cách ngập ngừng rằng độ tin cậy của các chế độ được hỗ trợ (nhưng không được thiết lập) bằng cách giải thích thực chất và bằng khả năng phân biệt cùng một phương thức trong các bộ dữ liệu khác có cùng kích thước. (Lớn hơn cũng tốt hơn ....)
Chúng tôi không thể bình luận về một trong những người ở đây. Một cách xử lý nhỏ về độ lặp lại là so sánh những gì bạn nhận được với các mẫu bootstrap có cùng kích thước. Dưới đây là kết quả của một thử nghiệm mã thông báo sử dụng Stata, nhưng những gì bạn thấy bị giới hạn tùy ý đối với các mặc định của Stata, bản thân chúng được ghi nhận là bị rơi ra khỏi không khí . Tôi có ước tính mật độ cho dữ liệu gốc và 24 mẫu bootstrap giống nhau.
Dấu hiệu (không hơn, không kém) là những gì tôi nghĩ các nhà phân tích có kinh nghiệm sẽ chỉ đoán bất kỳ cách nào từ biểu đồ của bạn. Chế độ tay trái có khả năng lặp lại cao và tay phải mỏng manh hơn rõ rệt.
Lưu ý rằng có một điều không thể tránh khỏi về điều này: vì có ít dữ liệu hơn ở chế độ bên tay phải, nó sẽ không luôn xuất hiện lại trong một mẫu bootstrap. Nhưng đây cũng là điểm mấu chốt.
Lưu ý rằng điểm 3. ở trên vẫn còn nguyên. Nhưng kết quả là một nơi nào đó giữa unimodal và bimodal.
Đối với những người quan tâm, đây là mã:
clear
set scheme s1color
set seed 2803
mat data = (10346, 13698, 13894, 19854, 28066, 26620, 27066, 16658, 9221, 13578, 11483, 10390, 11126, 13487, 15851, 16116, 24102, 30892, 25081, 14067, 10433, 15591, 8639, 10345, 10639, 15796, 14507, 21289, 25444, 26149, 23612, 19671, 12447, 13535, 10667, 11255, 8442, 11546, 15958, 21058, 28088, 23827, 30707, 19653, 12791, 13463, 11465, 12326, 12277, 12769, 18341, 19140, 24590, 28277, 22694, 15489, 11070, 11002, 11579, 9834, 9364, 15128, 15147, 18499, 25134, 32116, 24475, 21952, 10272, 15404, 13079, 10633, 10761, 13714, 16073, 23335, 29822, 26800, 31489, 19780, 12238, 15318, 9646, 11786, 10906, 13056, 17599, 22524, 25057, 28809, 27880, 19912, 12319, 18240, 11934, 10290, 11304, 16092, 15911, 24671, 31081, 27716, 25388, 22665, 10603, 14409, 10736, 9651, 12533, 17546, 16863, 23598, 25867, 31774, 24216, 20448, 12548, 15129, 11687, 11581)
set obs `=colsof(data)'
gen data = data[1,_n]
gen index = .
quietly forval j = 1/24 {
replace index = ceil(120 * runiform())
gen data`j' = data[index]
kdensity data`j' , nograph at(data) gen(xx`j' d`j')
}
kdensity data, nograph at(data) gen(xx d)
local xstuff xtitle(data/1000) xla(10000 "10" 20000 "20" 30000 "30") sort
local ystuff ysc(r(0 .0001)) yla(none) `ystuff'
local i = 1
local colour "orange"
foreach v of var d d? d?? {
line `v' data, lc(`colour') `xstuff' `ystuff' name(g`i', replace)
local colour "gs8"
local G `G' g`i'
local ++i
}
graph combine `G'