Tôi đã viết một kịch bản kiểm tra dữ liệu bằng cách sử dụng wilcox.test
, nhưng khi tôi nhận được kết quả, tất cả các giá trị p bằng 1. Tôi đọc trong một số trang web mà bạn có thể sử dụng jitter trước khi kiểm tra dữ liệu (để tránh ràng buộc như họ nói), Tôi đã làm điều này và bây giờ tôi có một kết quả chấp nhận được. Làm điều này có sai không?
test<- function(column,datacol){
library(ggplot2)
t=read.table("data.txt", stringsAsFactors=FALSE)
uni=unique(c(t$V9))
for (xp in uni) {
for(yp in uni) {
testx <- subset(t, V9==xp)
testy <- subset(t, V9==yp)
zz <- wilcox.test(testx[[datacol]],jitter(testy[[datacol]]))
p.value <- zz$p.value
}
}
}
Đây là đầu ra của
dput(head(t))
structure(list(V1 = c(0.268912,
0.314681, 0.347078, 0.286945,
0.39562, 0.282182), V2 = c(0.158921, 0.210526, 0.262024, 0.322006,
0.133417, 0.283025), V3 = c(0.214082, 0.166895, 0.132547, 0.147361,
0.09174, 0.169093), V4 = c(0.358085, 0.307898, 0.258352, 0.243688,
0.379224, 0.2657), V5= c(-0.142223, 0.010895, 0.14655,
0.08152, 0.02116, 0.030083), V6 = c(0.096408, -0.091896,
-0.331229, -0.446603, -0.088493, -0.262037), V7` = c(1.680946,
1.649559, 1.534401, 1.130529, 3.441356, 1.211815), V8 = c("NC_000834", "NC_000844",
"NC_000845", "NC_000846", "NC_000857",
"NC_000860" ), V9 = c("Chordata",
"Arthropoda", "Chordata", "Chordata",
"Arthropoda", "Chordata"), V10 =
c("???:???", "Diplostraca",
"???:???", "Rheiformes", "Diptera",
"Salmoniformes"), V11 = c("???:???",
"Branchiopoda", "Mammalia", "Aves",
"Insecta", "Actinopterygii" )), .Names
= c("V1", "V2", "V3", "V4", "V5", "V6", "V7",
"V8", "V9", "V10",
"V11"), row.names = c(NA, 6L),
class = "data.frame")
Dữ liệu rất lớn và đó là luồng tôi đã bắt đầu và họ nói với tôi rằng có thể sai khi làm điều này
Lưu ý Câu hỏi này xuất phát từ tex.SE: tạo đầu ra PDFcontain R bên trong bảng latex
dput()
chức năng rất hữu ích giúp loại bỏ mọi nhu cầu thực hiện điều đó. Vui lòng cung cấp một ví dụ tái sản xuất để nhận được hỗ trợ.