Sử dụng gói Google Causal Impact để đánh giá tầm quan trọng của can thiệp theo kế hoạch


7

Tôi đang sử dụng gói Tác động nhân quả trong R để suy ra tác động nhân quả của một can thiệp trong một số dữ liệu có tương quan cao và theo mùa.

Cụ thể, tôi nhận được 17 ngày dữ liệu hàng giờ, sự can thiệp xảy ra vào cuối ngày 13. Tôi có hai bộ dữ liệu kiểm soát hoàn toàn không bị ảnh hưởng bởi sự can thiệp (với tương quan tuyến tính là 0,708 và 0,701) và bộ dữ liệu bao gồm can thiệp ( còn gọi là "đối xử")

Một phần của dữ liệu có thể được tìm thấy ở đây

Mã của tôi là như sau

days <- 4
daily.obser <- days*24
data.1 <- cbind(treated.signal.3n,the.control.3,the.control.2)
data.1 <- data.1[1:((length(bsl)+1)+daily.obser), ] #check the required amount of data only 

matplot(data.1, type = "l",col = c(2,4,9))
legend("bottomright", inset=.05, legend=c("Treated Zone", "Control Zone 1", "Control Zone 2"), pch=1, col=c(2,4,9), horiz=TRUE)

preperiod <- c(1,length(bsl))
postperiod <- c((length(bsl)+1),(length(bsl)+1+daily.obs))
prior.level.sd.level <- 0.01

imp.1 <- CausalImpact(data.1, pre.period = preperiod, post.period = postperiod, 
         model.args = list(niter = 2500,nseasons=17, season.duration = 24, 
         dynamic.regression = FALSE, prior.level.sd =prior.level.sd.level,standardize.data = TRUE))

summary(imp.1)
plot(imp.1,c("original","pointwise"))
summary(imp.1,"report")

Câu hỏi của tôi là:

Tôi đã đọc bài báo và tại một số điểm, nó đang nói về phân phối trước cho phương sai. Tôi không hiểu những gì tôi nên đặt prior.level.sdtham số của mình , dựa trên dữ liệu của tôi.

Một vấn đề khác tôi phải đối mặt là các nseasons,season.durationđối số. Khi tôi chỉ định điều này, trong kết quả, tôi nhận thấy rằng sự can thiệp là không đáng kể (và CI đang trở nên rất lớn), trong khi khi tôi không làm như vậy, sự can thiệp là rất đáng kể. Được nseasonscho là số ngày cho toàn bộ tập dữ liệu hoặc chỉ trong khoảng thời gian dự phòng (ví dụ 17 hoặc 13)? Không xác định tính thời vụ trully có nghĩa là gì? Tôi có thể, dựa trên dữ liệu bỏ qua điều này?

Kết quả với các số đặc điểm kỹ thuật theo mùa

Kết quả không có và thông số kỹ thuật theo mùa

(không cung cấp tích lũy vì nó không hữu ích trong trường hợp của tôi)

(bạn sẽ nhận thấy rằng trong giai đoạn tiền dự phòng, sự phù hợp là không tốt. Tôi có thể khắc phục điều này bằng cách nào đó không?)

Tôi không hiểu, làm thế nào để tôi chỉ định nếu tôi muốn chuẩn hóa dữ liệu hay không.

Cuối cùng, tôi đang nghĩ về hồi quy tĩnh hoặc động. Tôi đọc trong bài báo rằng nên sử dụng tĩnh khi mối quan hệ giữa kiểm soát và điều trị ổn định. Ai đó có thể giải thích những gì có nghĩa là ổn định?

Bạn có thể tìm thấy bài báo ở đây

Câu trả lời:


-1

Về tính thời vụ. Từ tài liệu tham khảo:

. Ví dụ: nếu dữ liệu đại diện cho các quan sát hàng ngày, hãy sử dụng 7 cho thành phần ngày trong tuần. Giao diện này hiện chỉ hỗ trợ tối đa một thành phần theo mùa.

sử dụng model.args = list (ns Reason = 7, season.duration = 24) để thêm thành phần ngày trong tuần vào dữ liệu với độ chi tiết hàng giờ

Vì vậy, tôi nghĩ rằng trong trường hợp của bạn, tôi nghĩ ns Reason = 13, season.duration = 24 là tốt.


Điều gì có nghĩa là ổn định: Tôi hiểu điều đó có nghĩa là mối quan hệ của các hiệp phương sai, với chuỗi bạn đang theo dõi sẽ được duy trì (nhưng đối với sự can thiệp). Vì vậy, nếu tôi đang thực hiện một nghiên cứu về một số biện pháp ảnh hưởng đến giá nhà (y) và được sử dụng làm lương trung bình cộng, thì nếu Anh rời EU sẽ xảy ra trong thời gian can thiệp, điều đó có thể thay đổi mối quan hệ giữa giá nhà và trả. Vì vậy, giả định rằng mối quan hệ giữa hiệp phương sai và y là ổn định, sẽ bị phá vỡ.


Ưu tiên.level.sd, tôi không nghĩ là thứ gì đó bạn có thể suy ra từ dữ liệu của mình. Đó là một tham số được sử dụng bởi thuật toán, phải không?

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.