Tôi đã điểm chuẩn sample
hàm trong R và so sánh nó với igraph:sample_seq
một kết quả lạ.
Khi tôi chạy một cái gì đó như:
library(microbenchmark)
library(igraph)
set.seed(1234)
N <- 55^4
M <- 500
(mbm <- microbenchmark(v1 = {sample(N,M)},
v2 = {igraph::sample_seq(1,N,M)}, times=50))
Tôi nhận được một kết quả như thế này:
Unit: microseconds
expr min lq mean median uq max neval
v1 21551.475 22655.996 26966.22166 23748.2555 28340.974 47566.237 50
v2 32.873 37.952 82.85238 81.7675 96.141 358.277 50
Nhưng khi tôi chạy chẳng hạn,
set.seed(1234)
N <- 100^4
M <- 500
(mbm <- microbenchmark(v1 = {sample(N,M)},
v2 = {igraph::sample_seq(1,N,M)}, times=50))
Tôi nhận được kết quả nhanh hơn nhiều cho sample
:
Unit: microseconds
expr min lq mean median uq max neval
v1 52.165 55.636 64.70412 58.2395 78.636 88.120 50
v2 39.174 43.504 62.09600 53.5715 73.253 176.419 50
Có vẻ như khi N
có công suất 10 (hoặc một số đặc biệt nào khác?), sample
Nhanh hơn nhiều so với số nhỏ khác N
không phải là lũy thừa 10. Đây có phải là hành vi dự kiến hay tôi đang thiếu thứ gì?