Lời chào hỏi,
Hiện tại tôi đang làm như sau trong R:
require(zoo)
data <- read.csv(file="summary.csv",sep=",",head=TRUE)
cum = zoo(data$dcomp, as.Date(data$date))
data = zoo(data$compressed, as.Date(data$date))
data <- aggregate(data, identity, tail, 1)
cum <- aggregate(cum, identity, sum, 1)
days = seq(start(data), end(data), "day")
data2 = na.locf(merge(data, zoo(,days)))
plot(data2,xlab='',ylab='compressed bytes',col=rgb(0.18,0.34,0.55))
lines(cum,type="h",col=rgb(0,0.5,0))
Đoạn trích tóm tắt.csv:
date,revision,file,lines,nclass,nattr,nrel,bytes,compressed,diff,dcomp
2007-07-25,16,model.xml,96,11,22,5,4035,991,0,0
2007-07-27,17,model.xml,115,16,26,6,4740,1056,53,777
2007-08-09,18,model.xml,106,16,26,7,4966,1136,47,761
2007-08-10,19,model.xml,106,16,26,7,4968,1150,4,202
2007-09-06,81,model.xml,111,16,26,7,5110,1167,13,258
...
Hai dòng cuối cùng biểu thị thông tin tôi cần và kết quả tương tự như sau: Dòng màu xanh là entropy tính theo byte của tạo phẩm mà tôi quan tâm. Đường màu xanh lá cây đại diện cho entropy của những thay đổi.
Bây giờ, trong biểu đồ này, nó hoạt động tốt vì không có sự khác biệt lớn về tỷ lệ. Nhưng tôi có các biểu đồ khác trong đó các đường màu xanh lá cây trở nên nhỏ đến mức không thể nhìn thấy.
Giải pháp tôi đang tìm kiếm, liên quan đến hai điều:
- Để di chuyển các đường thẳng đứng màu xanh lá cây sang biểu đồ thứ hai, ngay bên dưới đường đầu tiên, với trục y của chính nó, nhưng trục x được chia sẻ.
- Để cung cấp cho nó thang đo logarit, vì tôi quan tâm đến "độ lớn" hơn là các giá trị cụ thể.
Cảm ơn trước!
PS Nếu ai đó cũng có thể cho tôi biết làm thế nào tôi có thể đặt "dấu tích nhỏ" trong thang đo x liên quan đến các tháng, tôi đánh giá cao :-) Nếu đây là quá nhiều câu hỏi cho một bài đăng, tôi có thể chia chúng thêm.