Chúng ta có thể nói gì về các mô hình về dữ liệu quan sát khi không có dụng cụ?


10

Trước đây tôi đã có một số câu hỏi được hỏi về tôi liên quan đến các bài báo được xuất bản trong một số lĩnh vực mà hồi quy (và các mô hình liên quan, chẳng hạn như mô hình bảng điều khiển hoặc GLM) được sử dụng trên dữ liệu quan sát (tức là dữ liệu không được tạo ra bởi thử nghiệm có kiểm soát , trong nhiều trường hợp - nhưng không phải luôn luôn - dữ liệu được quan sát theo thời gian) nhưng trong đó không có nỗ lực giới thiệu các biến công cụ được thực hiện.

Tôi đã đưa ra một số lời chỉ trích để phản hồi (chẳng hạn như mô tả các vấn đề sai lệch khi có thể thiếu các biến quan trọng) nhưng vì những người khác ở đây chắc chắn sẽ hiểu biết nhiều hơn tôi về chủ đề này, tôi đoán tôi sẽ hỏi:

  1. Các vấn đề / hậu quả chính của việc cố gắng đưa ra kết luận về các mối quan hệ (đặc biệt, nhưng không giới hạn ở kết luận nguyên nhân) trong các tình huống như vậy là gì?

  2. Có thể làm bất cứ điều gì hữu ích với các nghiên cứu phù hợp với các mô hình như vậy trong trường hợp không có dụng cụ?

  3. Một số tài liệu tham khảo tốt (sách hoặc giấy tờ) về các vấn đề với mô hình như vậy (tốt nhất là có động cơ phi kỹ thuật rõ ràng về hậu quả, vì thông thường những người hỏi có nhiều nền tảng, một số không có nhiều số liệu thống kê) mà mọi người có thể đề cập đến trong phê bình một tờ giấy? Thảo luận về các biện pháp phòng ngừa / vấn đề với các công cụ cũng sẽ hữu ích.

(Tài liệu tham khảo cơ bản về các biến công cụ có ở đây , mặc dù nếu bạn có bất kỳ bổ sung nào ở đó, điều đó cũng hữu ích.)

Con trỏ đến các ví dụ thực tế tốt về việc tìm và sử dụng các công cụ sẽ là một phần thưởng nhưng không phải là trung tâm của câu hỏi này.

[Tôi có thể sẽ chỉ cho người khác bất kỳ câu trả lời hay nào ở đây vì những câu hỏi như vậy đến với tôi. Tôi có thể thêm một hoặc hai ví dụ khi tôi nhận được chúng.]

Câu trả lời:


8

Vì vậy, phần lớn lĩnh vực của tôi (mặc dù không phải là phần tôi làm việc nhiều nhất) chỉ quan tâm đến điều này - sự phù hợp của các mô hình kiểu GLM với dữ liệu quan sát. Đối với hầu hết các phần, các biến công cụ là rất hiếm, do thiếu quen thuộc với kỹ thuật hoặc, quan trọng là, thiếu một công cụ tốt. Để giải quyết các câu hỏi của bạn theo thứ tự:

  1. Tất nhiên, vấn đề chính là một số loại gây nhiễu còn lại bởi một biến không quan sát được liên quan đến cả sự phơi bày và kết quả quan tâm. Phiên bản ngôn ngữ đơn giản là câu trả lời của bạn có thể sai, nhưng bạn không nhất thiết phải biết làm thế nào hoặc tại sao. Các quyết định được đưa ra dựa trên thông tin đó (như có sử dụng một điều trị cụ thể hay không, liệu điều X trong môi trường có nguy hiểm hay không, v.v.) là các quyết định được thực hiện khi sử dụng thông tin sai.

  2. Tôi khẳng định rằng câu trả lời cho điều này là có bởi vì, trong phần lớn, các nghiên cứu này đang cố gắng đạt được điều gì đó mà không nhất thiết phải là một công cụ tốt hoặc không thể ngẫu nhiên hóa được. Vì vậy, khi nói đến nó, thay thế là "Chỉ cần đoán". Những mô hình này, nếu không có gì khác, là sự chính thức hóa những suy nghĩ của chúng ta và một nỗ lực vững chắc để tiến gần đến câu trả lời, và dễ dàng vật lộn hơn.

Ví dụ: bạn có thể hỏi sự thiên vị sẽ nghiêm trọng đến mức nào để thay đổi một cách định tính câu trả lời của bạn (ví dụ: "Có, X có hại cho bạn ...") và đánh giá xem bạn có nghĩ rằng có hợp lý không có yếu tố không xác định sức mạnh đó ẩn giấu bên ngoài dữ liệu của bạn.

Ví dụ, phát hiện rằng nhiễm trùng HPV cực kỳ liên quan đến ung thư cổ tử cung là một phát hiện quan trọng và sức mạnh của một yếu tố không được đo lường sẽ thiên vị rằng tất cả các cách đến null đều phải mạnh mẽ đáng kinh ngạc.

Hơn nữa, cần lưu ý rằng một công cụ không khắc phục điều này - chúng chỉ hoạt động mà không có một số hiệp hội không được đo lường, và thậm chí các thử nghiệm ngẫu nhiên cũng gặp phải vấn đề (bỏ qua khác biệt giữa điều trị và kiểm soát, bất kỳ thay đổi hành vi ngẫu nhiên nào, tính khái quát đối với thực tế dân số mục tiêu) cũng được che đậy hơn một chút.

  1. Rothman, Greenland và Lash đã viết phiên bản mới nhất của Dịch tễ học hiện đại , về cơ bản là một cuốn sách dành cho việc cố gắng làm những điều này theo cách tốt nhất có thể.

8

Trái ngược với quan điểm từ phía nhà dịch tễ học được thể hiện bởi Fomite, các biến công cụ là một bộ công cụ thiết yếu trong kinh tế học được dạy khá sớm. Lý do cho điều này là có một sự tập trung rất lớn vào việc cố gắng trả lời các câu hỏi nguyên nhân trong nghiên cứu kinh tế ngày nay đi đến một phần mở rộng trong đó các mối tương quan đơn thuần thậm chí được coi là không thú vị. Hạn chế chính là kinh tế học là một lĩnh vực vốn dĩ rất khó thực hiện các thí nghiệm ngẫu nhiên. Nếu tôi muốn biết ảnh hưởng của cái chết sớm của cha mẹ đối với kết quả giáo dục lâu dài của trẻ thì hầu hết mọi người sẽ phản đối việc này thông qua con đường kiểm soát ngẫu nhiên - và đúng như vậy. Tài liệu này từ một khóa học của MIT phác thảo ở trang 3-5 về những vấn đề khác với các thí nghiệm.

Để giải quyết lần lượt từng điểm:

  1. Tùy thuộc vào câu hỏi cần trả lời, nó không chỉ là các biến bị bỏ qua mà có thể làm mất hiệu lực các phân tích trên dữ liệu quan sát mà không sử dụng các phương pháp không thử nghiệm. Các vấn đề lựa chọn, lỗi đo lường, quan hệ nhân quả ngược hoặc tính đồng thời có thể quan trọng như nhau. Vấn đề chính là nhà phân tích dữ liệu cần phải nhận thức được những hạn chế của cài đặt này. Điều này chủ yếu đề cập đến trường hợp kinh doanh bởi vì trong một kịch bản học thuật, điều này sẽ được phát hiện nhanh chóng. Đôi khi tôi thấy các nhà phân tích thị trường muốn ước tính độ co giãn của giá để thông báo cho khách hàng (ví dụ: nhu cầu giảm bao nhiêu nếu chúng ta tăng giá thêmx%), vì vậy họ ước tính một phương trình cầu và hoàn toàn quên hoặc bỏ qua thực tế là cung và cầu được xác định đồng thời, và cái này ảnh hưởng đến cái kia. Vì vậy, hậu quả phụ thuộc nhiều vào nhận thức của nhà nghiên cứu / nhà phân tích dữ liệu liên quan đến những hạn chế của dữ liệu hơn là chính dữ liệu, nhưng hậu quả có thể từ một thứ tầm thường đến mở rộng nơi chúng ảnh hưởng tiêu cực đến cuộc sống của mọi người.
  2. Hiển thị tương quan đôi khi có thể hữu ích, nó chỉ thực sự phụ thuộc vào câu hỏi. Khi tìm kiếm một hiệu ứng nhân quả cũng đủ nếu bạn có một thí nghiệm tự nhiên. Dữ liệu điều tra dân số ở Chile có thể là quan sát nhưng nếu bạn muốn biết trận động đất cuối cùng ảnh hưởng đến trình độ học vấn như thế nào (trong đó động đất được cho là ngoại sinh) thì dữ liệu quan sát cũng tốt để trả lời câu hỏi nguyên nhân.
    Ở một mức độ nhất định cũng có thể đánh giá mức độ nội sinh mà không cần dụng cụ (xem trang 9 trong tài liệu trên, 'Ước tính mức độ sai lệch của các biến bị bỏ qua'). Đối với điều trị không thử nghiệm nhị phânDibạn có thể tính toán hiệu quả của phương pháp điều trị này, làm tương tự đối với những người không quan sát được và hỏi sự thay đổi lớn trong những điều không quan sát được phải như thế nào để giải thích hiệu quả điều trị quan sát được. Nếu sự thay đổi không quan sát được phải rất lớn thì chúng ta có thể tin tưởng hơn một chút vào những phát hiện của mình. Tài liệu tham khảo cho điều này là Altonji, Elder và Taber (2000) .
  3. Có lẽ bất kỳ nhà kinh tế học ứng dụng nào cũng sẽ khuyến nghị Angrist và Pischke (2009) "Kinh tế lượng vô hại". Mặc dù cuốn sách này chủ yếu dành cho sinh viên tốt nghiệp và các nhà nghiên cứu, có thể bỏ qua các phần toán học của nó và chỉ cần có được trực giác cũng được giải thích độc đáo. Trước tiên, họ đưa ra ý tưởng về một thiết lập thử nghiệm, sau đó có xu hướng OLS và những hạn chế của nó đối với tính nội sinh từ các biến bị bỏ qua, tính đồng thời, lựa chọn, v.v. và sau đó thảo luận rộng rãi về các biến công cụ với một ví dụ tốt từ tài liệu ứng dụng. Họ cũng thảo luận các vấn đề với các biến công cụ như dụng cụ yếu hoặc sử dụng quá nhiều trong số chúng. Angrist và Krueger (2001) cũng cung cấp một cái nhìn tổng quan phi kỹ thuật về các biến công cụ và các cạm bẫy tiềm ẩn, và họ cũng có một bảng tóm tắt một số nghiên cứu và các công cụ của họ.

Có lẽ tất cả những điều này dài hơn một câu trả lời điển hình ở đây nhưng câu hỏi rất rộng. Tôi chỉ muốn nhấn mạnh rằng các biến công cụ (thường khó tìm) không phải là viên đạn duy nhất trong túi của chúng tôi. Có các phương pháp phi thực nghiệm khác để phát hiện ra các hiệu ứng nhân quả từ dữ liệu quan sát, chẳng hạn như khác biệt, thiết kế gián đoạn hồi quy, khớp hoặc hồi quy hiệu ứng cố định (nếu các yếu tố gây nhiễu của chúng ta là bất biến theo thời gian). Tất cả những điều này được thảo luận trong Angrist và Pischke (2009) và trong tài liệu được liên kết với lúc đầu.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.