Mô phỏng dữ liệu từ khung dữ liệu thiết kế thử nghiệm.
Tập trung vào R (mặc dù giải pháp ngôn ngữ khác sẽ rất tuyệt).
Khi thiết kế một thí nghiệm hoặc khảo sát, mô phỏng dữ liệu và tiến hành phân tích dữ liệu mô phỏng này có thể cung cấp cái nhìn sâu sắc tuyệt vời về ưu điểm và điểm yếu của thiết kế.
Cách tiếp cận như vậy cũng có thể cần thiết cho sự hiểu biết và sử dụng đúng các bài kiểm tra thống kê.
Tuy nhiên, quá trình này có xu hướng hơi tẻ nhạt và nhiều người được dẫn đến bỏ qua bước quan trọng này trong một thử nghiệm hoặc khảo sát.
Các mô hình thống kê và kiểm tra chứa hầu hết các thông tin cần thiết để mô phỏng dữ liệu (bao gồm cả giả định hoặc tuyên bố rõ ràng về phân phối).
Đưa ra một mô hình phân tích (và các giả định liên quan của nó, ví dụ: tính quy tắc và cân bằng), các mức của một yếu tố và thước đo tầm quan trọng (như giá trị p), tôi muốn có được dữ liệu mô phỏng (lý tưởng với chức năng tổng quát gần giống với in (), dự đoán (), mô phỏng ()).
Là một khung mô phỏng tổng quát như vậy có thể?
Nếu vậy, một khung như vậy hiện đang có sẵn?
Ví dụ, tôi muốn một hàm, chẳng hạn như:
sim(aov(response~factor1+factor2*factor3),
p.values=list(factor1=0.05,
factor2=0.05,
factor3=0.50,
factor2:factor3=0.05),
levels=list(factor1=1:10,
factor2=c("A", "B", "C"),
factor3=c("A", "B", "C")))
tức là, một phiên bản tổng quát của:
sim.lm<-function(){
library(DoE.base)
design<-fac.design(nlevels=c(10,3,3),
factor.names=c("factor1", "factor2", "factor3"),
replications=3,
randomize=F)
response<-with(design, as.numeric(factor1)+
as.numeric(factor2)+
as.numeric(factor3)+
as.numeric(factor2)*as.numeric(factor3)+
rnorm(length(factor1)))
simulation<-data.frame(design, response)}
HOẶC LÀ
sim(glm(response~factor1+factor2*factor3, family=poisson),
p.values=list(factor1=0.05,
factor2=0.05,
factor3=0.50,
factor2:factor3=0.05),
levels=list(factor1=1:10,
factor2=c("A", "B", "C"),
factor3=c("A", "B", "C")))
HOẶC LÀ
library(lme4)
sim(lmer(response~factor1+factor2 + (factor2|factor3)),
F_value=list(factor1=50,
factor2=50),
levels=list(factor1=1:10,
factor2=c("A", "B", "C"),
factor3=c("A", "B", "C")))
điều đó sẽ tạo ra một data.frame tương ứng hoàn chỉnh
ví dụ tiềm năng của các chức năng cụ thể (vui lòng chỉnh sửa theo ý muốn)
- arima.sim
Hàm tồn tại để tạo một data.frame của các cấp yếu tố, mà không có phản hồi được mô hình hóa:
vd. conf.design
http://cran.r-project.org/web/view/ExperimentalDesign.html