Có sự khác biệt giữa 'kiểm soát' và 'bỏ qua' các biến khác trong hồi quy bội không?


50

Hệ số của một biến giải thích trong hồi quy bội cho chúng ta biết mối quan hệ của biến giải thích đó với biến phụ thuộc. Tất cả điều này, trong khi "kiểm soát" cho các biến giải thích khác.

Làm thế nào tôi đã xem nó cho đến nay:

Trong khi mỗi hệ số đang được tính toán, các biến khác không được tính đến, vì vậy tôi cho rằng chúng bị bỏ qua.

Vậy tôi có đúng không khi tôi nghĩ rằng các thuật ngữ 'được kiểm soát' và 'bị bỏ qua' có thể được sử dụng thay thế cho nhau?


2
Tôi không quá say mê về câu hỏi này cho đến khi tôi thấy hai người cho rằng bạn đã truyền cảm hứng cho @gung.
DWin

1
Bạn không biết về cuộc trò chuyện mà chúng tôi đã có ở nơi khác thúc đẩy câu hỏi này, @DWin. Đó là quá nhiều để cố gắng giải thích điều này trong một bình luận, vì vậy tôi đã yêu cầu OP biến nó thành một câu hỏi chính thức. Tôi thực sự nghĩ rằng việc đưa ra sự khác biệt rõ ràng b / t bỏ qua và kiểm soát các biến khác trong hồi quy là một câu hỏi tuyệt vời, và tôi rất vui vì nó đã được thảo luận ở đây.
gung - Phục hồi Monica

2
xem thêm sơ đồ đầu tiên ở đây
Glen_b

1
Là dữ liệu được sử dụng trong câu hỏi này có sẵn để chúng tôi có thể tự chạy nó như một mẫu giáo dục.
Larry

Câu trả lời:


88

Kiểm soát một cái gì đó và bỏ qua một cái gì đó không phải là điều tương tự. Hãy xem xét một vũ trụ trong đó chỉ có 3 biến tồn tại: , và . Chúng tôi muốn xây dựng mô hình hồi quy dự đoán và chúng tôi đặc biệt quan tâm đến mối quan hệ của nó với . Có hai khả năng cơ bản. YX1X2YX1

  1. Chúng ta có thể đánh giá mối quan hệ giữa và trong khi kiểm soát cho : hay,X1YX2
    Y=β0+β1X1+β2X2
  2. chúng tôi có thể đánh giá mối quan hệ giữa và trong khi bỏ qua : X1Y X2

    Y=β0+β1X1

Cấp, đây là những mô hình rất đơn giản, nhưng chúng tạo thành các cách khác nhau để xem mối quan hệ giữa và biểu hiện như thế nào . Thông thường, các ước tính có thể giống nhau ở cả hai mô hình, nhưng chúng có thể khá khác nhau. Điều quan trọng nhất trong việc xác định mức độ khác nhau của chúng là mối quan hệ (hoặc thiếu) giữa và . Hãy xem xét con số này: Y beta 1 X 1 X 2X1Yβ^1X1X2

nhập mô tả hình ảnh ở đây

Trong trường hợp này, tương quan với . Vì cốt truyện là hai chiều, nên nó bỏ qua (có lẽ trớ trêu thay), vì vậy tôi đã chỉ ra các giá trị của cho mỗi điểm bằng các ký hiệu và màu sắc riêng biệt (âm mưu giả 3D dưới đây cung cấp một cách khác để cố gắng hiển thị cấu trúc của dữ liệu). Nếu chúng ta phù hợp với mô hình hồi quy mà bỏ qua , chúng ta sẽ có được đường hồi quy màu đen. Nếu chúng ta khớp với một mô hình được điều khiển cho , chúng ta sẽ có một mặt phẳng hồi quy, một lần nữa rất khó để vẽ đồ thị, vì vậy tôi đã vẽ ba lát cắt qua mặt phẳng đó trong đó , vàX 2 X 2 X 2 X 2 X 2 X 2 = 1 X 2 = 2 X 2 = 3 X 1 Y X 2 X 2X1X2X2X2 X2X2X2=1X2=2X2=3. Do đó, chúng tôi có các dòng cho thấy mối quan hệ giữa và giữ rằng khi chúng ta kiểm soát cho . Lưu ý, chúng tôi thấy rằng việc kiểm soát không mang lại một dòng, mà là một tập hợp các dòng. X1YX2 X2

nhập mô tả hình ảnh ở đây

Một cách khác để suy nghĩ về sự khác biệt giữa bỏ quakiểm soát một biến khác, là xem xét sự phân biệt giữa phân phối biênphân phốiđiều kiện . Hãy xem xét con số này:

nhập mô tả hình ảnh ở đây

( Điều này được lấy từ câu trả lời của tôi ở đây: Trực giác đằng sau các phân phối Gaussian có điều kiện là gì? )

Nếu bạn nhìn vào đường cong bình thường được vẽ bên trái của hình chính, đó là biên phân phối của . Đó là sự phân bố của nếu chúng ta bỏ qua mối quan hệ của nó với . Trong hình chính, có hai đường cong bình thường biểu thị các phân phối có điều kiện của khi và . Phân phối có điều kiện kiểm soát mức , trong khi phân phối biên bỏ qua nó. Y X Y X 1 = 25 X 1 = 45 X 1YYXYX1=25X1=45X1


2
Gung, điều này thật kỳ diệu, tôi vui vì tôi đã phạm sai lầm khi sử dụng từ 'bỏ qua' trong câu trả lời của mình cho câu hỏi đó. Bây giờ tôi sẽ thử tìm hiểu chính xác các gói thống kê 'kiểm soát' cho các biến khác như thế nào. (Suy nghĩ đầu tiên của tôi là họ sử dụng một số biện pháp như hệ số tương quan của quả lê. Với nhiều biến giải thích, mọi thứ sẽ trở nên lộn xộn) Cảm ơn bạn vì câu trả lời này!
Siddharth Gopi

1
Bạn được chào đón, @garciaj, mặc dù tôi chưa hoàn thành ;-). Tôi đang tìm kiếm một con số khác; Tôi có thể phải làm nó từ đầu.
gung - Phục hồi Monica

4
Ý tưởng quan trọng trong hình đầu tiên là những điểm đó nằm trong một không gian ba chiều, với các vòng tròn màu đỏ trên một mặt phẳng ở màn hình máy tính, các hình tam giác màu xanh trên mặt phẳng song song trước màn hình và màu xanh lá cây điểm cộng trên một mặt phẳng một chút ở phía trước đó. Mặt phẳng hồi quy nghiêng xuống bên phải, nhưng dốc lên khi nó di chuyển từ màn hình về phía bạn. Lưu ý rằng hiện tượng này xảy ra do X1 & X2 có mối tương quan với nhau, nếu chúng không tương thích, các betas ước tính sẽ giống nhau.
gung - Tái lập Monica

1
Và loại tương quan giữa các yếu tố dự đoán (ví dụ: kịch bản @gung) là điều thường làm cơ sở cho nghịch lý của Simpson . Trong một vũ trụ có nhiều hơn ba biến số, thật khôn ngoan khi nhớ rằng nó có thể đang ẩn giấu những suy luận của bạn (d'oh!).
FairMiles

2
@MSIS, khi bạn điều khiển một biến trong mô hình, mô hình cố gắng giữ nó không đổi (cố định) để ước tính mọi thứ khác trong mô hình. Tuy nhiên, đây chỉ là một nỗ lực & chịu lỗi ngẫu nhiên, do đó, nó không nhất thiết giống với những gì bạn sẽ nhận được nếu bạn thực hiện một nghiên cứu với một biến cố định về mặt vật lý ở một giá trị nhất định.
gung - Phục hồi Monica

8

Họ không được bỏ qua. Nếu họ bị 'phớt lờ' thì họ sẽ không ở trong mô hình. Ước tính của biến quan tâm giải thích là có điều kiện trên các biến khác. Ước tính được hình thành "trong bối cảnh" hoặc "cho phép tác động của" các biến khác trong mô hình.


Dự toán tất nhiên là tùy thuộc vào các biến khác. Nhưng chúng ta phải làm sạch nó bằng cách giới thiệu cái gọi là các yếu tố khác trong mô hình. Tuy nhiên, đôi khi các yếu tố này có thể có tính chất phân loại và gây ra nhiều vấn đề hơn là đưa ra một giải pháp hợp lệ.
Subhash C. Davar
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.