Làm thế nào để kiểm tra xem một hệ số hồi quy có được kiểm duyệt bởi một biến nhóm không?


9

Tôi có một hồi quy được thực hiện trên hai nhóm mẫu dựa trên một biến kiểm duyệt (giả sử giới tính). Tôi đang thực hiện một thử nghiệm đơn giản cho hiệu ứng kiểm duyệt bằng cách kiểm tra xem tầm quan trọng của hồi quy có bị mất trên một tập hay không trong khi tập còn lại.

Q1: Phương pháp trên là hợp lệ, phải không?

Q2: Mức độ tin cậy của nghiên cứu của tôi được đặt ở mức 95%. Đối với một nhóm, hồi quy có ý nghĩa ở mức 0,000. Mặt khác, nó có ý nghĩa ở 0,038 Vì vậy, tôi tin rằng tôi phải chấp nhận cả hai hồi quy là quan trọng và không có tác dụng kiểm duyệt. Bằng cách chấp nhận hồi quy có ý nghĩa trong khi nó được chứng minh là không phải là 0,01 giờ sáng, tôi gây ra lỗi Loại I (chấp nhận đối số sai lệch)?

Câu trả lời:


12

Phương pháp của bạn dường như không giải quyết được câu hỏi, giả sử rằng "hiệu ứng kiểm duyệt" là một thay đổi trong một hoặc nhiều hệ số hồi quy giữa hai nhóm. Các xét nghiệm quan trọng trong hồi quy đánh giá xem các hệ số có khác không. So sánh giá trị p trong hai hồi quy cho bạn biết rất ít (nếu có) về sự khác biệt về các hệ số đó giữa hai mẫu.

Thay vào đó, giới thiệu giới tính như một biến giả và tương tác nó với tất cả các hệ số quan tâm. Sau đó kiểm tra tầm quan trọng của các hệ số liên quan.

Ví dụ: trong trường hợp đơn giản nhất (của một biến độc lập), dữ liệu của bạn có thể được biểu thị dưới dạng danh sách các bộ dữ liệu trong đó g i là giới tính, được mã hóa là 01 . Mô hình cho giới 0(xi,yi,gi)gi010

yi=α0+β0xi+εi

(trong đó lập chỉ mục dữ liệu cho g i = 0 ) và mô hình cho giới 1igi=01

yi=α1+β1xi+εi

(trong đó lập chỉ mục dữ liệu cho g i = 1 ). Các tham số là α 0 , α 1 , β 0β 1 . Các lỗi là ε i . Giả sử chúng độc lập và phân phối giống hệt nhau với phương tiện bằng không. Một mô hình kết hợp để thử nghiệm cho một sự khác biệt trong sườn (các β 's) có thể được viết nhưigi=1α0α1β0β1εiβ

yi=α+β0xi+(β1β0)(xigi)+εi

(Ở đâu nằm trên tất cả các dữ liệu) bởi vì khi bạn đặt g i = 0, số hạng cuối cùng sẽ bị loại bỏ, đưa ra mô hình đầu tiên với α = α 0 và khi bạn đặt g i = 1 , hai bội số của x i kết hợp để đưa ra β 1 , năng suất mô hình thứ hai với α = α 1 . Do đó, bạn có thể kiểm tra xem các sườn có giống nhau không ("hiệu ứng kiểm duyệt") bằng cách lắp mô hìnhigi=0α=α0gi=1xiβ1α=α1

yi=α+βxi+γ(xigi)+εi

γ^

yi=α+δgi+βxi+γ(xigi)+εi.

δ^

εi


Cảm ơn tôi có thể hiểu làm thế nào điều này hoạt động. Phương pháp này có hoạt động không nếu tôi có nhiều biến kiểm duyệt? Nói ví dụ, khu vực (nông thôn / thành thị), trình độ học vấn (trung học có giáo dục / không)? Tôi có thể thêm các biến giả và kiểm tra hiệu ứng không?
Bọ cạp

1
@whuber, tôi thỉnh thoảng gặp các tình huống tương tự về chức năng, trong đó nhà phân tích chỉ đơn giản chia mẫu thành hai nhóm, sử dụng cùng một bộ biến độc lập cho cả hai nhóm và chỉ so sánh một cách định tính các hệ số. Có bất kỳ lợi thế nào của tình huống mà tôi vừa mô tả về công thức sử dụng hiệu ứng tương tác này không?
Andy W

3
@Andy Không có bất kỳ ý định nào có vẻ nghiêm trọng hoặc phản đối, lợi thế duy nhất tôi có thể nghĩ đến cho phương pháp định tính là nó không đòi hỏi sự hiểu biết hay năng lực của nhà phân tích: điều này giúp nhiều người có thể tiếp cận được. Cách tiếp cận định tính đầy khó khăn. Ví dụ, có thể có sự khác biệt lớn rõ ràng giữa cả hai sườn và các điểm chặn chỉ do cơ hội. Một đánh giá định tính chỉ các hệ số sẽ không thể phân biệt tình huống này với các hiệu ứng thực tế.
whuber

1
@whuber, suy nghĩ ban đầu của tôi là như vậy và gần đây tôi đã đưa ra đề nghị tương tự cho một đồng nghiệp đã bỏ qua đề xuất này vì mục đích đơn giản (như bạn đã ám chỉ). Tôi nghĩ có lẽ nhận xét về giả định về phương sai lỗi là giống nhau cho cả hai giới có thể làm cho cách tiếp cận hai mô hình phù hợp hơn với giả định rằng giả định bị vi phạm.
Andy W

1
@Andy Có, nhưng khả năng của các phương sai khác nhau không nâng cao giá trị của một so sánh không định tính. Thay vào đó, nó sẽ gọi một so sánh định lượng sắc thái hơn của các ước tính tham số. Ví dụ, như một xấp xỉ thô (nhưng có nhiều thông tin), người ta có thể thực hiện một biến thể của phép thử t CABF hoặc Satterthwaite dựa trên phương sai lỗi ước tính và mức độ tự do của chúng. Ngay cả việc kiểm tra trực quan của một biểu đồ phân tán được xây dựng tốt cũng sẽ dễ thực hiện và nhiều thông tin hơn là chỉ đơn giản là so sánh các hệ số hồi quy.
whuber

-1

Tôi đoán việc kiểm duyệt một biến nhóm sẽ hoạt động tốt như nhau khi so sánh các hệ số hồi quy trên các sóng dữ liệu cắt ngang độc lập (ví dụ: year1, year2 và year3 như nhóm1 nhóm2 và nhóm3)?

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.