Bạn có muốn tỷ lệ trong mẫu chính xác là tỷ lệ đã nêu? hoặc để thể hiện ý tưởng lấy mẫu từ một dân số rất lớn với các tỷ lệ đó (vì vậy tỷ lệ mẫu sẽ gần nhưng không chính xác)?
Nếu bạn muốn tỷ lệ chính xác thì bạn có thể làm theo gợi ý của Brandon và sử dụng sample
hàm R để chọn ngẫu nhiên thứ tự của một vectơ có tỷ lệ chính xác.
Nếu bạn muốn lấy mẫu từ dân số, nhưng không giới hạn tỷ lệ chính xác thì bạn vẫn có thể sử dụng sample
hàm trong R với prob
đối số như vậy:
> x <- sample( LETTERS[1:4], 10000, replace=TRUE, prob=c(0.1, 0.2, 0.65, 0.05) )
> prop.table(table(x))
x
A B C D
0.0965 0.1972 0.6544 0.0519
x <- rep( c("A","B","C","D"), 10000*c(0.1,0.2,0.65,0.05) )
và bạn không cần chỉ định 10000 trong lệnh gọi để lấy mẫu, đó sẽ là mặc định (mặc dù để rõ ràng, việc xác định nó không gây hại gì).