Điểm số của xu hướng khác với việc cộng các biến số trong hồi quy như thế nào và khi nào chúng được ưu tiên hơn sau này?


41

Tôi thừa nhận tôi tương đối mới với điểm số xu hướng và phân tích nguyên nhân.

Một điều không rõ ràng đối với tôi khi là người mới đến là cách "cân bằng" sử dụng điểm số xu hướng khác biệt về mặt toán học với những gì xảy ra khi chúng ta thêm các biến số trong hồi quy? Điều gì khác biệt về hoạt động, và tại sao nó (hoặc nó) tốt hơn so với việc thêm các biến số phụ trong một hồi quy?

Tôi đã thấy một số nghiên cứu so sánh thực nghiệm các phương pháp, nhưng tôi chưa thấy một cuộc thảo luận tốt nào liên quan đến các tính chất toán học của hai phương pháp và tại sao PSM cho vay để giải thích nguyên nhân trong khi bao gồm cả phương pháp hồi quy không. Dường như cũng có rất nhiều nhầm lẫn và tranh cãi trong lĩnh vực này, điều này làm cho mọi thứ trở nên khó khăn hơn để chọn.

Bất kỳ suy nghĩ về điều này hoặc bất kỳ con trỏ đến tài nguyên / giấy tờ tốt để hiểu rõ hơn sự khác biệt? (Tôi đang dần dần tìm thấy cuốn sách nhân quả của Judea Pearl, vì vậy không cần phải chỉ cho tôi điều đó)


3
Đề nghị bạn đọc Morgan và Winship, 2007 . Chương 4 và 5 thực hiện một so sánh rõ ràng và độ tương phản của hồi quy và kết hợp để xác định hiệu ứng nhân quả.
liên hợp chiến binh

1
Khi bạn kiểm tra số liệu thống kê số dư, bạn đảm bảo rằng không có phép ngoại suy giữa các nhóm điều trị mà bạn đang so sánh với không gian đồng biến đa chiều. Hồi quy chỉ đơn giản là ngoại suy mà không kiểm tra điều này, vì vậy phép ngoại suy có thể đưa ra dự đoán kém.
StatsStudent

Câu trả lời:


17

Một điểm khác biệt lớn là hồi quy "điều khiển" các đặc tính đó theo kiểu tuyến tính. Kết hợp theo điểm số xu hướng sẽ loại bỏ giả định tuyến tính, nhưng, vì một số quan sát có thể không khớp, bạn có thể không thể nói bất cứ điều gì về các nhóm nhất định.

Ví dụ, nếu bạn đang học chương trình đào tạo công nhân, bạn có thể có tất cả những người đăng ký là nam giới, nhưng nhóm người không tham gia kiểm soát bao gồm nam và nữ. Sử dụng hồi quy, bạn có thể hồi quy, thu nhập, giả sử, trên biến chỉ số tham gia và chỉ báo nam. Bạn sẽ sử dụng tất cả dữ liệu của mình và có thể ước tính thu nhập của một phụ nữ mà cô ấy đã tham gia chương trình.

Nếu bạn đang kết hợp, bạn chỉ có thể kết hợp nam với nam. Do đó, bạn sẽ không sử dụng bất kỳ phụ nữ nào trong phân tích của mình và kết quả của bạn sẽ không liên quan đến họ.

Hồi quy có thể ngoại suy bằng cách sử dụng giả định tuyến tính, nhưng khớp không thể. Tất cả các giả định khác về cơ bản là giống nhau giữa hồi quy và khớp. Lợi ích của việc so khớp qua hồi quy là nó không tham số (ngoại trừ bạn phải cho rằng bạn có điểm số phù hợp, nếu đó là cách bạn đang thực hiện so khớp).

Để thảo luận thêm, hãy xem trang của tôi ở đây để biết một khóa học tập trung nhiều vào các phương pháp phù hợp. Xem các giả định chiến lược ước tính hiệu quả nhân quả đặc biệt .

Ngoài ra, hãy chắc chắn kiểm tra bài viết Rosenbaum và Rubin (1983) để phác thảo điểm phù hợp với xu hướng.

Cuối cùng, kết hợp đã đi một chặng đường dài kể từ năm 1983. Hãy xem trang web của Jas Sekhon để tìm hiểu về thuật toán kết hợp di truyền của anh ấy.


3
Có thể điều này là do tôi không phải là một nhà thống kê, nhưng khi có vẻ như bạn giả định hồi quy tuyến tính khi OP hỏi về hồi quy nói chung. Nhưng tôi đoán ý chính là việc thêm đồng biến vào bất kỳ loại hồi quy nào tạo ra một số giả định về không gian đầu vào để nó có thể ngoại suy thành các ví dụ mới, và kết hợp thận trọng hơn về loại sự vật nào có thể được ngoại suy.
rrenaud

2
Bạn thực hiện một số giả định về dạng chức năng của các biến gây nhiễu khi bạn ước tính hàm xu hướng. Sau đó, bạn cũng khớp với các cá nhân có giá trị "gần" của xu hướng, vì vậy tôi sẽ không ngay lập tức cho rằng khớp phù hợp giải quyết vấn đề về các hiệu ứng gây nhiễu phi tuyến.
AdamO

2
Các liên kết bị hỏng.
Carlos Cinelli

11

Câu trả lời ngắn gọn là điểm số xu hướng không tốt hơn mô hình ANCOVA tương đương, đặc biệt liên quan đến giải thích nguyên nhân.

Điểm số được hiểu rõ nhất là một phương pháp giảm dữ liệu. Chúng là một phương tiện hiệu quả để giảm nhiều đồng biến thành một điểm số duy nhất có thể được sử dụng để điều chỉnh hiệu ứng quan tâm cho một tập hợp các biến. Khi làm như vậy, bạn tiết kiệm mức độ tự do bằng cách điều chỉnh cho một điểm số xu hướng duy nhất thay vì nhiều đồng biến. Điều này trình bày một lợi thế thống kê, chắc chắn, nhưng không có gì hơn.

Một câu hỏi có thể nảy sinh khi sử dụng điều chỉnh hồi quy với điểm số xu hướng là liệu có bất kỳ lợi ích nào trong việc sử dụng điểm số thay vì thực hiện điều chỉnh hồi quy với tất cả các hiệp phương thức được sử dụng để ước tính điểm số có trong mô hình hay không. Rosenbaum và Rubin đã chỉ ra rằng "ước tính điểm về hiệu quả điều trị từ phân tích điều chỉnh hiệp phương sai cho đa biến X bằng với ước tính thu được từ điều chỉnh hiệp phương sai đơn biến cho phân biệt tuyến tính mẫu dựa trên X, bất cứ khi nào sử dụng cùng một ma trận hiệp phương sai mẫu. cho cả điều chỉnh hiệp phương sai và phân tích phân biệt ". Do đó, kết quả từ cả hai phương pháp sẽ dẫn đến cùng một kết luận. Tuy nhiên, Một lợi thế để thực hiện thủ tục hai bước là người ta có thể phù hợp với mô hình điểm xu hướng rất phức tạp với các tương tác và các điều khoản bậc cao hơn trước. Vì mục tiêu của mô hình điểm xu hướng này là để có được xác suất được chỉ định điều trị tốt nhất, nên người ta không quan tâm đến việc tham số hóa quá mức mô hình này.

Từ:

CÁC PHƯƠNG PHÁP TÌM KIẾM SỞ HỮU ĐỂ GIẢM GIÁ BIAS TRONG SO SÁNH CỦA MỘT ĐIỀU TRỊ CHO MỘT NHÓM KIỂM SOÁT KHÔNG GIỚI HẠN

D'Agostino (trích dẫn Rosenbaum và Rubin)

D'agostino, RB 1998. Kết hợp điểm số theo tỷ lệ để giảm sai lệch khi so sánh điều trị với nhóm đối chứng không ngẫu nhiên. Y học thống kê 17: 2265 từ2281.


5
(+1) Ngoài ra còn có một chủ đề thú vị về vấn đề nhân quả trong câu hỏi liên quan này, Từ góc độ thống kê, người ta có thể suy ra quan hệ nhân quả bằng cách sử dụng điểm số xu hướng với một nghiên cứu quan sát không? .
chl

3
Tôi đồng ý với tiền đề chung của câu trả lời này, nhưng khi một trận đấu dựa trên điểm số của xu hướng thì nó không giống như đưa tất cả các đồng biến vào mô hình (và do đó không chỉ là một kỹ thuật giảm kích thước). Nó cũng không giống nhau nếu một trọng số theo điểm số của xu hướng.
Andy W

1
Tôi không đồng ý với câu trả lời này. Điểm số xu hướng ước tính là tốt khi chúng cân bằng các đồng biến trong các nhóm điều trị và kiểm soát và xấu khi không. Cũng giống như cho một phương pháp điều hòa hồi quy. Việc họ 'tốt hơn' chỉ phụ thuộc vào tài sản đó, điều này sẽ thay đổi tùy theo vấn đề.
liên hợp chiến binh

1
Tôi không đồng ý vì trong khi tiêu chí, sự cân bằng, giống nhau thì hai chiến lược lại khác nhau, cũng như điểm mạnh và điểm yếu của chúng. Một có thể hoặc không thể là một cách tiếp cận tốt hơn, tùy thuộc vào vấn đề. Thật vậy, " mô hình ANCOVA tương đương " đối với tôi dường như không được xác định rõ. (Tương đương như thế nào?)
liên hợp chiến

1
Đúng. Bây giờ tôi thấy "tương đương" nghĩa là gì, nhưng câu bắt đầu 'Tuy nhiên' trong trích dẫn của bạn giới thiệu sự khác biệt có liên quan: trong thực tế chống đỡ. điểm số được ước tính riêng biệt một cách chính xác để họ có thể cách gnarly hơn các mô hình phân tích. (Và có một sự khác biệt khác trong đoạn văn sau của bài viết, không được trích dẫn.)
liên hợp

7

Một tài liệu tham khảo có khả năng gây khó chịu, nhưng nếu bạn tình cờ có quyền truy cập vào nó, tôi khuyên bạn nên đọc chương sách này ( Apel và Sweeten, 2010 ). Nó nhắm vào các nhà khoa học xã hội và vì vậy có lẽ không nghiêm ngặt về mặt toán học như bạn muốn, nhưng nó cần đi sâu đủ để có nhiều hơn một câu trả lời thỏa đáng cho câu hỏi của bạn.

Có một vài cách khác nhau mà mọi người đối xử với điểm số của xu hướng có thể dẫn đến kết luận khác nhau từ việc đơn giản bao gồm các đồng biến trong mô hình hồi quy. Khi một trận đấu đạt điểm, người ta không nhất thiết phải có sự hỗ trợ chung cho tất cả các quan sát (tức là người ta có một số quan sát dường như không bao giờ có cơ hội nằm trong nhóm điều trị và một số luôn nằm trong nhóm điều trị). Ngoài ra người ta có thể quan sát trọng lượng theo nhiều cách khác nhau có thể dẫn đến kết luận khác nhau.

Ngoài các câu trả lời ở đây tôi cũng đề nghị bạn kiểm tra các câu trả lời cho câu hỏi chl trích dẫn. Có nhiều chất đằng sau điểm số xu hướng hơn là một thủ thuật thống kê để đạt được sự cân bằng đồng biến. Bạn đã đọc và hiểu các bài báo được trích dẫn nhiều bởi Rosenbaum và Rubin, sẽ rõ hơn lý do tại sao cách tiếp cận này khác với việc chỉ thêm các đồng biến trong mô hình hồi quy. Tôi nghĩ rằng một câu trả lời thỏa đáng hơn cho câu hỏi của bạn không nhất thiết là trong toán học đằng sau điểm số xu hướng mà là logic của chúng.


@Andy W Xem trích dẫn từ Rosenbaum và Rubin về sự tương đương của hồi quy với hiệp phương sai và điều chỉnh điểm xu hướng trong bài đăng cập nhật của tôi.
Brett

0

Tôi thích nghĩ về PS như một phần thiết kế của nghiên cứu tách biệt hoàn toàn với phân tích. Đó là, bạn có thể muốn nghĩ về mặt thiết kế (PS) và phân tích (hồi quy, v.v.). Ngoài ra, PS cung cấp một phương tiện hỗ trợ khả năng trao đổi để điều trị nhị phân; có lẽ những người khác có thể nhận xét về việc bao gồm các đồng biến trong mô hình kết quả có thể hỗ trợ trao đổi một cách mạnh mẽ hay không, liệu người ta có thể trao đổi khả năng trao đổi trước khi đưa các hiệp phương sai vào mô hình kết quả hay không.


-3

Phương pháp thống kê Med Res. Ngày 19 tháng 4 năm 2016.

Một đánh giá về độ lệch trong các mô hình hồi quy phi tuyến tính được điều chỉnh theo xu hướng.

Các phương pháp cho điểm phổ biến thường được sử dụng để điều chỉnh cho nhiễu gây nhiễu khi ước tính hiệu quả điều trị có điều kiện trong các nghiên cứu quan sát. Một phương pháp phổ biến, điều chỉnh đồng biến số điểm của xu hướng trong mô hình hồi quy, đã được chứng minh bằng thực nghiệm là sai lệch trong các mô hình phi tuyến tính. Tuy nhiên, không có lý do lý thuyết cơ bản thuyết phục đã được trình bày. Chúng tôi đề xuất một khung mới để điều tra sự thiên vị và tính nhất quán của các hiệu ứng điều trị được điều chỉnh theo xu hướng trong các mô hình phi tuyến tính sử dụng phương pháp hình học đơn giản để tạo ra mối liên hệ giữa tính nhất quán của công cụ ước tính điểm xu hướng và khả năng thu gọn của các mô hình phi tuyến tính. Trong khuôn khổ này, chúng tôi chứng minh rằng việc điều chỉnh điểm số xu hướng trong mô hình kết quả dẫn đến sự phân rã các hiệp phương sai quan sát thành điểm số xu hướng và thời hạn còn lại. Bỏ sót thuật ngữ còn lại này từ mô hình hồi quy không thể thu gọn dẫn đến ước tính sai lệch về tỷ lệ chênh lệch có điều kiện và tỷ lệ rủi ro có điều kiện, nhưng không phải là tỷ lệ có điều kiện. Chúng tôi tiếp tục chỉ ra, thông qua các nghiên cứu mô phỏng, độ lệch trong các ước lượng điều chỉnh điểm theo xu hướng này tăng với kích thước hiệu ứng điều trị lớn hơn, hiệu ứng hiệp biến lớn hơn và tăng sự khác biệt giữa các hệ số của mô hình điều trị so với mô hình kết quả.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.