Tôi đang sử dụng gói Tác động nhân quả trong R để suy ra tác động nhân quả của một can thiệp trong một số dữ liệu có tương quan cao và theo mùa.
Cụ thể, tôi nhận được 17 ngày dữ liệu hàng giờ, sự can thiệp xảy ra vào cuối ngày 13. Tôi có hai bộ dữ liệu kiểm soát hoàn toàn không bị ảnh hưởng bởi sự can thiệp (với tương quan tuyến tính là 0,708 và 0,701) và bộ dữ liệu bao gồm can thiệp ( còn gọi là "đối xử")
Một phần của dữ liệu có thể được tìm thấy ở đây
Mã của tôi là như sau
days <- 4
daily.obser <- days*24
data.1 <- cbind(treated.signal.3n,the.control.3,the.control.2)
data.1 <- data.1[1:((length(bsl)+1)+daily.obser), ] #check the required amount of data only
matplot(data.1, type = "l",col = c(2,4,9))
legend("bottomright", inset=.05, legend=c("Treated Zone", "Control Zone 1", "Control Zone 2"), pch=1, col=c(2,4,9), horiz=TRUE)
preperiod <- c(1,length(bsl))
postperiod <- c((length(bsl)+1),(length(bsl)+1+daily.obs))
prior.level.sd.level <- 0.01
imp.1 <- CausalImpact(data.1, pre.period = preperiod, post.period = postperiod,
model.args = list(niter = 2500,nseasons=17, season.duration = 24,
dynamic.regression = FALSE, prior.level.sd =prior.level.sd.level,standardize.data = TRUE))
summary(imp.1)
plot(imp.1,c("original","pointwise"))
summary(imp.1,"report")
Câu hỏi của tôi là:
Tôi đã đọc bài báo và tại một số điểm, nó đang nói về phân phối trước cho phương sai. Tôi không hiểu những gì tôi nên đặt prior.level.sd
tham số của mình , dựa trên dữ liệu của tôi.
Một vấn đề khác tôi phải đối mặt là các nseasons,season.duration
đối số. Khi tôi chỉ định điều này, trong kết quả, tôi nhận thấy rằng sự can thiệp là không đáng kể (và CI đang trở nên rất lớn), trong khi khi tôi không làm như vậy, sự can thiệp là rất đáng kể. Được nseasons
cho là số ngày cho toàn bộ tập dữ liệu hoặc chỉ trong khoảng thời gian dự phòng (ví dụ 17 hoặc 13)? Không xác định tính thời vụ trully có nghĩa là gì? Tôi có thể, dựa trên dữ liệu bỏ qua điều này?
Kết quả với các lô và số đặc điểm kỹ thuật theo mùa
Kết quả không có lô và thông số kỹ thuật theo mùa
(không cung cấp tích lũy vì nó không hữu ích trong trường hợp của tôi)
(bạn sẽ nhận thấy rằng trong giai đoạn tiền dự phòng, sự phù hợp là không tốt. Tôi có thể khắc phục điều này bằng cách nào đó không?)
Tôi không hiểu, làm thế nào để tôi chỉ định nếu tôi muốn chuẩn hóa dữ liệu hay không.
Cuối cùng, tôi đang nghĩ về hồi quy tĩnh hoặc động. Tôi đọc trong bài báo rằng nên sử dụng tĩnh khi mối quan hệ giữa kiểm soát và điều trị ổn định. Ai đó có thể giải thích những gì có nghĩa là ổn định?
Bạn có thể tìm thấy bài báo ở đây