Tôi đang chạy một mô phỏng trên R và một cụm máy tính và gặp vấn đề sau. Trên mỗi máy tính X tôi chạy:
fxT2 <- function(i) runif(10)
nessay <- 100
c(mclapply(1:nessay, fxT2), recursive=TRUE)
Có 32 máy tính, mỗi máy có 16 lõi. Tuy nhiên, khoảng 2% số ngẫu nhiên là giống hệt nhau. Những chiến lược nào bạn sẽ áp dụng để tránh điều này?
Tôi đã có thể tránh vấn đề này cho fxT2 bằng cách đặt độ trễ (nghĩa là trì hoãn trong một giây thời gian mà mỗi công việc được gửi đến từng máy tính X). Nhưng nó có vẻ rất đặc biệt đối với fxt2.
Vấn đề là trong thực tế fxT2 là một nhiệm vụ dài liên quan đến các số ngẫu nhiên giả. Khi kết thúc quá trình, tôi hy vọng sẽ có được sao chép X * nessay của cùng một thử nghiệm thống kê, chứ không phải sao chép nessay. Làm thế nào để đảm bảo rằng đây thực sự là trường hợp và có cách nào để kiểm tra điều này?.