Sự khác biệt về công cụ ước tính sự khác biệt Sự khác biệt về sự khác biệt (DiD) là một công cụ để ước tính hiệu quả điều trị so sánh sự khác biệt trước và sau điều trị trong kết quả điều trị và nhóm đối chứng. Nói chung, chúng tôi quan tâm đến việc ước tính hiệu quả của việc điều trị (ví dụ như tình trạng liên minh, thuốc men, v.v.) đối với kết quả (ví dụ: tiền lương, sức khỏe, v.v.) như trong
trong đó là các hiệu ứng cố định riêng lẻ (đặc điểm của các cá nhân không thay đổi theo thời gian), là các hiệu ứng cố định theo thời gian, là các đồng biến thời gian khác nhau như tuổi của cá nhân vàY i Y i t = α i + λ t + ρ D i t + X ' i t β + ε i t α i λ t X i t ε i t i t D i tDiYi
Yit=αi+λt+ρDit+X′itβ+ϵit
αiλtXitϵit là một thuật ngữ lỗi. Cá nhân và thời gian được lập chỉ mục bởi và , tương ứng. Nếu có mối tương quan giữa các hiệu ứng cố định và thì việc ước tính hồi quy này thông qua OLS sẽ bị sai lệch do các hiệu ứng cố định không được kiểm soát. Đây là
sai lệch biến điển hình
bỏ qua .
itDit
Để thấy hiệu quả của một điều trị, chúng tôi muốn biết sự khác biệt giữa một người trong một thế giới mà cô ấy được điều trị và một người mà cô ấy không điều trị. Tất nhiên, chỉ có một trong số này là có thể quan sát được trong thực tế. Do đó, chúng tôi tìm kiếm những người có cùng xu hướng tiền điều trị trong kết quả. Giả sử chúng ta có hai giai đoạn và hai nhóm . Sau đó, theo giả định rằng các xu hướng trong các nhóm điều trị và kiểm soát sẽ tiếp tục giống như trước đây khi không điều trị, chúng tôi có thể ước tính hiệu quả điều trị là
t=1,2s=A,B
ρ=(E[Yist|s=A,t=2]−E[Yist|s=A,t=1])−(E[Yist|s=B,t=2]−E[Yist|s=B,t=1])
Về mặt đồ họa, nó sẽ trông giống như thế này:
Bạn có thể chỉ cần tính toán các phương tiện này bằng tay, tức là có được kết quả trung bình của nhóm trong cả hai giai đoạn và lấy sự khác biệt của chúng. Sau đó có được kết quả trung bình của nhóm trong cả hai giai đoạn và lấy sự khác biệt của chúng. Sau đó, lấy sự khác biệt trong sự khác biệt và đó là hiệu quả điều trị. Tuy nhiên, sẽ thuận tiện hơn khi thực hiện việc này trong khung hồi quy vì điều này cho phép bạnAB
- để kiểm soát các đồng biến
- để có được các lỗi tiêu chuẩn cho hiệu quả điều trị để xem nó có đáng kể hay không
Để làm điều này, bạn có thể làm theo một trong hai chiến lược tương đương. Tạo một nhóm điều khiển giả bằng 1 nếu một người thuộc nhóm và 0, tạo ra một hình nộm thời gian bằng 1 nếu và 0 nếu không, và sau đó hồi quy
treatiAtimett=2
Yit=β1+β2(treati)+β3(timet)+ρ(treati⋅timet)+ϵit
Hoặc bạn chỉ đơn giản tạo ra một hình nộm bằng với một người trong nhóm điều trị VÀ khoảng thời gian là khoảng thời gian sau điều trị và bằng không. Sau đó, bạn sẽ hồi quy
Y i t = β 1 γ s + β 2 λ t + ρ T i t + ε i tTit
Yit=β1γs+β2λt+ρTit+ϵit
trong đó lại là một hình nộm cho nhóm điều khiển và là những kẻ giả thời gian. Hai hồi quy cho bạn kết quả giống nhau trong hai giai đoạn và hai nhóm. Phương trình thứ hai là tổng quát hơn mặc dù nó dễ dàng mở rộng ra nhiều nhóm và khoảng thời gian. Trong cả hai trường hợp, đây là cách bạn có thể ước tính sự khác biệt về tham số khác biệt theo cách mà bạn có thể bao gồm các biến điều khiển (Tôi đã bỏ qua các phương trình trên để không làm lộn xộn chúng nhưng bạn chỉ có thể đưa chúng vào) và nhận được các lỗi tiêu chuẩn cho suy luận.λ tγsλt
Tại sao sự khác biệt trong ước tính khác biệt hữu ích?
Như đã nêu trước đây, DiD là một phương pháp để ước tính hiệu quả điều trị với dữ liệu phi thực nghiệm. Đó là tính năng hữu ích nhất. DiD cũng là một phiên bản của ước tính hiệu ứng cố định. Trong khi mô hình hiệu ứng cố định giả định , DiD đưa ra một giả định tương tự nhưng ở cấp độ nhóm, . Vì vậy, giá trị mong đợi của kết quả ở đây là tổng của một nhóm và hiệu ứng thời gian. Vậy sự khác biệt là gì? Đối với DID bạn không nhất thiết cần dữ liệu bảng miễn là mặt cắt ngang lặp đi lặp lại của bạn được rút ra từ các đơn vị tổng hợp cùng . Điều này làm cho DiD có thể áp dụng cho một mảng dữ liệu rộng hơn so với các mô hình hiệu ứng cố định tiêu chuẩn yêu cầu dữ liệu bảng. E ( Y 0 i t | s , t ) = γ s + λ t sE(Y0it|i,t)=αi+λtE(Y0it|s,t)=γs+λts
Chúng ta có thể tin tưởng sự khác biệt trong sự khác biệt?
Giả định quan trọng nhất trong DiD là giả định xu hướng song song (xem hình trên). Không bao giờ tin tưởng vào một nghiên cứu không thể hiện bằng đồ họa những xu hướng này! Giấy tờ trong những năm 1990 có thể đã nhận được điều này nhưng ngày nay sự hiểu biết của chúng ta về DiD tốt hơn nhiều. Nếu không có biểu đồ thuyết phục cho thấy các xu hướng song song trong kết quả tiền điều trị cho các nhóm điều trị và kiểm soát, hãy thận trọng. Nếu giả định xu hướng song song giữ và chúng ta có thể loại trừ đáng tin cậy bất kỳ thay đổi biến thể thời gian nào khác có thể gây nhiễu cho điều trị, thì DiD là một phương pháp đáng tin cậy.
Một lời cảnh báo khác nên được áp dụng khi điều trị các lỗi tiêu chuẩn. Với nhiều năm dữ liệu, bạn cần điều chỉnh các lỗi tiêu chuẩn cho tự động tương quan. Trong quá khứ, điều này đã bị bỏ qua nhưng kể từ khi Bertrand et al. (2004) "Chúng ta nên tin tưởng vào sự khác biệt về ước tính chênh lệch bao nhiêu?" chúng tôi biết rằng đây là một vấn đề. Trong bài báo họ cung cấp một số biện pháp khắc phục sự cố tương quan. Đơn giản nhất là phân cụm trên mã định danh bảng điều khiển riêng lẻ cho phép tương quan tùy ý của phần dư giữa các chuỗi thời gian riêng lẻ. Điều này sửa cho cả tự tương quan và không đồng nhất.
Để tham khảo thêm, xem các ghi chú bài giảng của Waldinger và Pischke .