Kiểm soát một cái gì đó và bỏ qua một cái gì đó không phải là điều tương tự. Hãy xem xét một vũ trụ trong đó chỉ có 3 biến tồn tại: , và . Chúng tôi muốn xây dựng mô hình hồi quy dự đoán và chúng tôi đặc biệt quan tâm đến mối quan hệ của nó với . Có hai khả năng cơ bản. YX1X2YX1
- Chúng ta có thể đánh giá mối quan hệ giữa và trong khi kiểm soát cho :
hay,X1YX2
Y=β0+β1X1+β2X2
chúng tôi có thể đánh giá mối quan hệ giữa và trong khi bỏ qua : X1Y X2
Y=β0+β1X1
Cấp, đây là những mô hình rất đơn giản, nhưng chúng tạo thành các cách khác nhau để xem mối quan hệ giữa và biểu hiện như thế nào . Thông thường, các ước tính có thể giống nhau ở cả hai mô hình, nhưng chúng có thể khá khác nhau. Điều quan trọng nhất trong việc xác định mức độ khác nhau của chúng là mối quan hệ (hoặc thiếu) giữa và . Hãy xem xét con số này: Y beta 1 X 1 X 2X1Yβ^1X1X2
Trong trường hợp này, tương quan với . Vì cốt truyện là hai chiều, nên nó bỏ qua (có lẽ trớ trêu thay), vì vậy tôi đã chỉ ra các giá trị của cho mỗi điểm bằng các ký hiệu và màu sắc riêng biệt (âm mưu giả 3D dưới đây cung cấp một cách khác để cố gắng hiển thị cấu trúc của dữ liệu). Nếu chúng ta phù hợp với mô hình hồi quy mà bỏ qua , chúng ta sẽ có được đường hồi quy màu đen. Nếu chúng ta khớp với một mô hình được điều khiển cho , chúng ta sẽ có một mặt phẳng hồi quy, một lần nữa rất khó để vẽ đồ thị, vì vậy tôi đã vẽ ba lát cắt qua mặt phẳng đó trong đó , vàX 2 X 2 X 2 X 2 X 2 X 2 = 1 X 2 = 2 X 2 = 3 X 1 Y X 2 X 2X1X2X2X2 X2X2X2=1X2=2X2=3. Do đó, chúng tôi có các dòng cho thấy mối quan hệ giữa và giữ rằng khi chúng ta kiểm soát cho . Lưu ý, chúng tôi thấy rằng việc kiểm soát không mang lại một dòng, mà là một tập hợp các dòng. X1YX2 X2
Một cách khác để suy nghĩ về sự khác biệt giữa bỏ qua và kiểm soát một biến khác, là xem xét sự phân biệt giữa phân phối biên và phân phối có điều kiện . Hãy xem xét con số này:
( Điều này được lấy từ câu trả lời của tôi ở đây: Trực giác đằng sau các phân phối Gaussian có điều kiện là gì? )
Nếu bạn nhìn vào đường cong bình thường được vẽ bên trái của hình chính, đó là biên phân phối của . Đó là sự phân bố của nếu chúng ta bỏ qua mối quan hệ của nó với . Trong hình chính, có hai đường cong bình thường biểu thị các phân phối có điều kiện của khi và . Phân phối có điều kiện kiểm soát mức , trong khi phân phối biên bỏ qua nó. Y X Y X 1 = 25 X 1 = 45 X 1YYXYX1=25X1=45X1