Phân công ngẫu nhiên: tại sao phải bận tâm?


9

Phân công ngẫu nhiên có giá trị vì nó đảm bảo sự độc lập của điều trị khỏi các kết quả tiềm năng. Đó là cách nó dẫn đến các ước tính không thiên vị về hiệu quả điều trị trung bình. Nhưng các chương trình chuyển nhượng khác cũng có thể đảm bảo một cách có hệ thống sự độc lập của điều trị khỏi các kết quả tiềm năng. Vậy tại sao chúng ta cần sự phân công ngẫu nhiên? Nói cách khác, lợi thế của việc gán ngẫu nhiên so với các sơ đồ chuyển nhượng không hợp lý cũng dẫn đến suy luận không thiên vị?

ZZiPr(Z=c)=Pr(Z=c)ccιTc=ιTcι

Nói cách khác, yêu cầu là gán là ngẫu nhiên nếu bất kỳ vectơ chuyển nhượng nào bao gồm gán cho điều trị cũng giống như bất kỳ vectơ nào khác bao gồm gán cho điều trị.Zimm

Nhưng, để đảm bảo tính độc lập của các kết quả tiềm năng từ chỉ định điều trị, điều đó đủ để đảm bảo rằng mỗi đơn vị trong nghiên cứu có xác suất chuyển nhượng điều trị như nhau. Và điều đó có thể dễ dàng xảy ra ngay cả khi hầu hết các vectơ chỉ định điều trị không có xác suất được chọn. Đó là, nó có thể xảy ra ngay cả dưới sự phân công không hợp lý.

Đây là một ví dụ. Chúng tôi muốn chạy thử nghiệm với bốn đơn vị trong đó chính xác hai đơn vị được xử lý. Có sáu vectơ chuyển nhượng có thể:

  1. 1100
  2. 1010
  3. 1001
  4. 0110
  5. 0101
  6. 0011

trong đó chữ số đầu tiên trong mỗi số cho biết liệu đơn vị thứ nhất đã được xử lý hay chưa, chữ số thứ hai cho biết liệu đơn vị thứ hai có được xử lý hay không, v.v.

Giả sử rằng chúng tôi chạy một thử nghiệm trong đó chúng tôi loại trừ khả năng các vectơ gán 3 và 4, nhưng trong đó mỗi vectơ khác có cơ hội được chọn bằng (25%). Sơ đồ này không phải là sự phân công ngẫu nhiên theo nghĩa AIR. Nhưng trong kỳ vọng, nó dẫn đến một ước tính không thiên vị về hiệu quả điều trị trung bình. Và đó không phải là ngẫu nhiên. Bất kỳ kế hoạch chuyển nhượng nào mang lại cho các đối tượng xác suất chuyển nhượng điều trị bằng nhau sẽ cho phép ước tính không thiên vị về ATE.

Vậy: tại sao chúng ta cần gán ngẫu nhiên theo nghĩa AIR? Lập luận của tôi bắt nguồn từ suy luận ngẫu nhiên; thay vào đó, nếu người ta nghĩ về phương diện suy luận dựa trên mô hình, định nghĩa AIR có vẻ phòng thủ hơn không?


3
Tôi chưa đọc Angrist và cộng sự, vì vậy có lẽ tôi đang thiếu một cái gì đó, nhưng tôi có một sự ngụy biện với sự phrasing của bạn. Chúng tôi không sử dụng chỉ định ngẫu nhiên để đảm bảo rằng việc điều trị không phụ thuộc vào kết quả tiềm năng. Việc điều trị có độc lập với kết quả trong một thí nghiệm thực sự hay không phụ thuộc vào việc có mối liên hệ nhân quả trực tiếp nào với việc điều trị & kết quả hay không. Thay vào đó, chỉ định ngẫu nhiên đảm bảo rằng việc điều trị không phụ thuộc vào các biến ẩn (hoặc, các yếu tố gây nhiễu tiềm ẩn). Đó là khả năng kết quả được gây ra bởi một cái gì đó khác hơn là điều trị mà chúng tôi hy vọng loại trừ.
gung - Phục hồi Monica

1
@gung, tôi nghĩ rằng bạn đang kết hợp "kết quả tiềm năng" và "kết quả." Đúng là sự phân công ngẫu nhiên không đảm bảo sự độc lập của điều trị khỏi kết quả (nghĩa là, từ kết quả quan sát được). Nhưng kết quả tiềm năng không giống như kết quả quan sát được, và chỉ định ngẫu nhiên không đảm bảo sự độc lập của điều trị với kết quả tiềm năng. Tôi sẽ không chỉnh sửa bài gốc để mở rộng về điểm này; làm như vậy sẽ đưa tôi đi quá xa khỏi chủ đề chính. Nhưng en.wikipedia.org/wiki/Rubin_causal_model có thể hữu ích về điểm này.
dùng697473

3
"[T] o đảm bảo tính độc lập của các kết quả tiềm năng từ việc chỉ định điều trị, đủ để đảm bảo rằng mỗi đơn vị trong nghiên cứu có xác suất chuyển nhượng điều trị như nhau." Điều này là không chính xác. Giả sử bạn đã đăng ký nam và nữ trong một nghiên cứu. Lật một đồng xu công bằng: nếu người đứng đầu, chỉ định tất cả phụ nữ vào nhóm điều trị (và tất cả nam giới vào nhóm kiểm soát); nếu đuôi, tất cả nam giới sẽ nằm trong nhóm điều trị và tất cả nữ giới trong nhóm đối chứng. Mỗi đối tượng (rõ ràng) có 50% cơ hội được chỉ định cho nhóm điều trị - nhưng việc điều trị hoàn toàn bị nhầm lẫn với giới tính. xx
whuber

1
@whuber, bình luận của bạn không đúng. Để xem tại sao, giả sử = 1. Kết quả tiềm năng của người đàn ông là Y (1) = 1 và Y (0) = 0. (Nghĩa là, = 1 nếu người đàn ông được điều trị, 0 nếu không.) Đối với người phụ nữ, kết quả tiềm năng là Y (1) = -1 và Y (0) = 2. (Kết quả tiềm năng cụ thể không quan trọng lắm, nhưng số nguyên nhỏ giữ mọi thứ đơn giản.) Sau đó E [Y (1) | Z] = E [Y (1)] = 0. Các đẳng thức tương tự giữ cho E [Y (0)]. Tổng quát hơn, cơ chế chuyển nhượng của bạn không bị giới hạn bởi giới tính và nó sẽ tạo ra ước tính ATE không thiên vị. Nếu tôi hiểu nhầm điều gì đó, xin vui lòng cho tôi biết. xYm
dùng697473

3
Chắc chắn, ước tính là "không thiên vị" theo cùng một nghĩa là đồng hồ dừng lại đưa ra ước tính không thiên vị về thời gian! Trên thực tế, điều tồi tệ hơn thế: phương pháp lựa chọn ngẫu nhiên này mang lại kết quả không thể quy cho việc điều trị, bởi vì chúng cũng có thể được quy cho giới tính. Đó là những gì gây nhiễu có nghĩa. Tập trung vào việc thu được kết quả không thiên vị trong khi phá hủy tất cả thông tin hữu ích trong thí nghiệm là câu tục ngữ ném ra khỏi em bé ...
whuber

Câu trả lời:


8

Điều này theo dõi bình luận của gung. Hiệu quả điều trị trung bình tổng thể không phải là điểm.

Giả sử bạn có trường hợp mắc bệnh tiểu đường mới trong đó đối tượng nằm trong độ tuổi từ đến và bệnh nhân tiểu đường mới trên . Bạn muốn chỉ định một nửa để điều trị. Tại sao không lật một đồng xu, và trên đầu, điều trị cho tất cả các bệnh nhân trẻ tuổi và trên đuôi, điều trị tất cả các bệnh nhân lớn tuổi? Mỗi người sẽ có100051510003050%cơ hội được lựa chọn điều trị qua lại, vì vậy điều này sẽ không làm sai lệch kết quả trung bình của điều trị, nhưng nó sẽ ném đi rất nhiều thông tin. Sẽ không có gì đáng ngạc nhiên nếu bệnh tiểu đường ở tuổi vị thành niên hoặc bệnh nhân trẻ tuổi tỏ ra đáp ứng tốt hơn hoặc tồi tệ hơn so với bệnh nhân lớn tuổi mắc bệnh tiểu đường loại II hoặc tiểu đường thai kỳ. Hiệu quả điều trị quan sát được có thể không thiên vị, nhưng, ví dụ, nó sẽ có độ lệch chuẩn lớn hơn nhiều so với xảy ra thông qua chỉ định ngẫu nhiên, và mặc dù mẫu lớn bạn sẽ không thể nói nhiều. Nếu bạn sử dụng chỉ định ngẫu nhiên, thì với xác suất cao, khoảng trường hợp ở mỗi nhóm tuổi sẽ được điều trị, do đó bạn có thể so sánh điều trị với không điều trị trong mỗi nhóm tuổi. 500

Bạn có thể làm tốt hơn là sử dụng sự phân công ngẫu nhiên. Nếu bạn nhận thấy một yếu tố bạn nghĩ có thể ảnh hưởng đến đáp ứng điều trị, bạn có thể muốn đảm bảo rằng các đối tượng có thuộc tính đó được phân chia đồng đều hơn so với sẽ xảy ra thông qua chỉ định ngẫu nhiên. Phân công ngẫu nhiên cho phép bạn làm tốt hợp lý với tất cả các yếu tố đồng thời, để bạn có thể phân tích nhiều mẫu có thể sau đó.


Cảm ơn, Douglas. Câu trả lời này có ý nghĩa với tôi. Đối với hồ sơ, tôi không có ý nghĩ gì như ví dụ của bạn hoặc ví dụ của @ whuber ở trên. Tôi đã suy nghĩ thay vì các trường hợp chúng tôi loại bỏ khỏi việc xem xét chỉ một vài vectơ điều trị. (Hãy xem xét trường hợp khách hàng nói rằng "bạn có thể đối xử với người này hoặc người kia, nhưng không phải cả hai.") Nhưng tôi nghĩ rằng điểm chung của bạn giữ ngay cả đối với những trường hợp nhẹ hơn mà tôi có trong tâm trí.
dùng697473

Tôi nghĩ rằng nếu bạn chỉ loại bỏ một vài vectơ, thì bạn không thay đổi lượng thông tin bạn có thể trích xuất nhiều. Định lượng chính xác điều này có thể lộn xộn - có những giới hạn ngây thơ có lẽ quá bi quan.
Douglas Zare

@DoumundZare Tôi có một câu hỏi về ví dụ cực đoan của bạn. Tôi tin rằng mục tiêu là tìm ra liệu phương pháp điều trị có hiệu quả đối với dân số có cả bệnh nhân trẻ và già hay không. Sau đó, phương pháp của bạn sẽ tạo ra hai mẫu không thể được coi là mẫu đại diện từ phân phối kết quả tiềm năng nơi tất cả mọi người thực hiện điều trị và phân phối kết quả tiềm năng nơi tất cả mọi người kiểm soát. Vì vậy, sau đó hiệu quả điều trị được quan sát của bạn là sai lệchFtFc
KevinKim

1

Trong ví dụ của bạn, bạn có thể để lại 2 và 5 và không mâu thuẫn với chính mình. Ở cấp độ vật phẩm vẫn có cơ hội bằng 1 hoặc 0 khi chỉ có tỷ lệ 1: 1 chọn 1 hoặc 6. Nhưng, bây giờ những gì bạn đã làm bằng cách loại bỏ 3 và 4 trở nên rõ ràng hơn.


Cảm ơn, John. Ừ bạn đúng rồi đó. Dường như chúng ta có thể loại bỏ bao nhiêu vectơ chỉ định điều trị tùy thích, trong bất kỳ kết hợp nào, miễn là chúng ta sử dụng các vectơ còn lại theo cách cho mỗi đơn vị xác suất chuyển nhượng điều trị bằng nhau.
dùng697473

Tôi không nghĩ rằng bạn đang nhận được những gì tôi đang nói. Những gì tôi đã trình bày là trường hợp vô lý quảng cáo cho lập luận của bạn lập luận chống lại nó.
Giăng

Ví dụ của bạn là cực kỳ, nhưng tôi không thấy bất cứ điều gì vô lý về nó. Đó là một minh chứng hợp lệ cho điểm: các sơ đồ gán không ngẫu nhiên (như chỉ sử dụng vectơ 1 và 6) có thể dẫn trực tiếp đến ước tính không thiên vị về hiệu quả điều trị trung bình. Theo sau chúng ta không cần gán ngẫu nhiên để có được ước tính ATE không thiên vị. Tất nhiên, vẫn có thể có lý do tại sao việc loại bỏ các vectơ 2 đến 5. (xem bình luận của Douglas Zare ở trên ). Tôi chưa nghĩ đến những lý do này.
dùng697473

Bạn nên. Đó là lý do tại sao bạn không thể loại bỏ chúng.
Giăng

1

Đây là một trong những biến số ẩn hoặc gây nhiễu: thời gian (hoặc trôi công cụ, ảnh hưởng của việc lưu trữ mẫu, v.v.).
Vì vậy, có những lập luận chống lại sự ngẫu nhiên (như Douglas nói: bạn có thể làm tốt hơn so với ngẫu nhiên). Ví dụ, bạn có thể biết trước rằng bạn muốn các trường hợp của bạn được cân bằng theo thời gian. Cũng như bạn có thể biết trước rằng bạn muốn cân bằng giới tính và tuổi tác.

Nói cách khác, nếu bạn muốn chọn thủ công một trong 6 sơ đồ của mình, tôi sẽ nói rằng 1100 (hoặc 0011) là một lựa chọn tồi tệ . Lưu ý rằng những khả năng đầu tiên bạn ném ra là những thứ cân bằng nhất về thời gian ... Và hai thứ tồi tệ nhất còn lại sau khi John đề nghị loại bỏ cả 2 và 5 (mà bạn không phản đối).
Nói cách khác, trực giác của bạn là những kế hoạch "tốt đẹp" không may dẫn đến thiết kế thử nghiệm tồi (IMHO điều này khá phổ biến; có thể mọi thứ đã được sắp xếp đẹp hơn - và chắc chắn việc theo dõi các chuỗi logic trong quá trình thử nghiệm sẽ dễ dàng hơn).

Bạn có thể có thể làm tốt hơn với các chương trình không ngẫu nhiên, nhưng bạn cũng có thể làm tồi tệ hơn nhiều. IMHO, bạn sẽ có thể đưa ra các đối số vật lý / hóa học / sinh học / y tế / ... cho sơ đồ không ngẫu nhiên cụ thể mà bạn sử dụng, nếu bạn sử dụng sơ đồ không ngẫu nhiên.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.