Điều đó có nghĩa là gì (theo trực giác) để giữ các biến khác không đổi trong hồi quy?


9

Tôi đang tìm kiếm cả 1) cơ học và 2) giải thích trực quan về cách ảnh hưởng của các biến riêng lẻ được xác định giữ các biến khác không đổi.

Trong một ví dụ sử dụng dữ liệu khảo sát, chính xác nó có nghĩa là gì:

"giữ tuổi, giới tính và thu nhập không đổi, ảnh hưởng của giáo dục là ___"

Tôi hiểu rằng với hồi quy, chúng tôi đang cố gắng tạo lại bối cảnh thử nghiệm và trong ví dụ trên đang cố gắng so sánh các nhóm dân số với độ tuổi, giới tính, thu nhập, v.v., nhưng với mức độ giáo dục khác nhau và ước tính sự khác biệt trong trung bình của các quần thể đó. Câu hỏi:

  1. Liệu trực giác này có đúng không?
  2. Những quần thể này có nhất thiết phải tồn tại? Điều gì xảy ra nếu khảo sát không chứa người trả lời có cùng giá trị trên các điều khiển?
  3. Làm thế nào là không chắc chắn về các ước tính của các quần thể này được xác định?


Là một phần dẫn xuất "trực quan" với bạn?
Aksakal

Câu trả lời:


5

Trực giác là một chủ đề khó, nó phụ thuộc vào nền tảng của người đó. Chẳng hạn, tôi học thống kê sau khi học vật lý toán học. Đối với tôi trực giác là trong các dẫn xuất một phần. Hãy xem xét một mô hình hồi quy Nó có thể được diễn tả lại như y i = f ( x i , z i ) + ε i , nơi f ( x , z ) = b

yTôi= =một+bxxTôi+bzzTôi+εTôi
yTôi= =f(xTôi,zTôi)+εTôi,
f(x,z)= =bxx+bzz

Lấy tổng đạo hàm của hàm : d f = ff()

df= =fxdx+fzdz

x zxfxf

fx= =limΔx0f(x+Δx,z)-f(x,z)Δx
zxfx
fx= =bx

Nói cách khác, trong mô hình tuyến tính đơn giản, các hệ số của bạn là các đạo hàm riêng (độ dốc) liên quan đến các biến. Đó là những gì "giữ không đổi" có nghĩa với tôi bằng trực giác.


1
Tôi đánh giá cao trực giác này, nhưng một số phần trong mô tả của bạn có thể bất ngờ gây rắc rối cho một số người. Tôi sẽ chú ý đến (1) cách xác định đạo hàm riêng cho các hồi quy phân loại và (2) quyết định cách xác định các đạo hàm riêng khi các hồi quy là các hàm của các hồi quy khác, như trong hồi quy đa thức hoặc khi bao gồm các tương tác.
whuber

2
  1. Trực giác là chính xác ở cơ sở của nó. Tôi cũng sẽ cố gắng trả lời một cách ngắn gọn và trực quan
  2. Các quần thể phụ đó nhất thiết tồn tại bởi vì bạn giữ chúng không đổi bằng cách: (a) lấy mẫu các đối tượng của bạn liên quan đến các đồng biến suy đoán của bạn HOẶC (b) bạn đặt một ràng buộc về tính biến thiên của nó (tức là phương sai = 0). Điều này được thực hiện bằng cách lấy 1 nhóm (ví dụ: chỉ nam, tóc vàng, v.v.) nếu biến phân loại của nó hoặc bằng cách lấy trung bình của một hiệp phương thức nhất định (tuổi, trình độ học vấn, thu nhập, v.v.).

6
Câu trả lời này dường như loại trừ tất cả các ứng dụng hồi quy có thể có đối với các bộ dữ liệu không thử nghiệm hoặc quan sát (ngoại trừ những ứng dụng có thể được mở rộng với nhiều quan sát hơn, rất hiếm). Vì vậy, nó dường như bị hạn chế không cần thiết, và vì vậy có lẽ không công bằng cho các khái niệm cơ bản.
whuber

2

Như user122677 đã trả lời, trực giác là đúng: Trong hồi quy tuyến tính, mọi hệ số là lượng thay đổi trong kết quả khi một giá trị biến được tăng lên bởi một đơn vị trong khi tất cả các biến khác không đổi. Nói cách khác, các hệ số là dẫn xuất một phần của dự đoán mô hình đối với từng biến.

Dù sao, hãy cẩn thận rằng nếu mô hình của chúng tôi bao gồm các biến tương tác không thể thay đổi mà không thay đổi tương tác và do đó, việc giải thích một hệ số này không thể có ý nghĩa như một thay đổi thực sự. Điều tương tự cũng xảy ra với hồi quy đa thức, trong đó không có thuật ngữ nào có thể thay đổi mà không thay đổi các điều khoản khác.

Về sự tồn tại của các quần thể đó, chúng không cần tồn tại. Trong một số thiết kế thử nghiệm chúng có thể tồn tại, nhưng trong các nghiên cứu quan sát với các biến liên tục, chúng rất khó tồn tại. Ví dụ:

  • Trong các thiết kế hoàn chỉnh của các thí nghiệm với các biến nhị phân (hoặc hữu hạn rời rạc), tất cả sự kết hợp các giá trị của các biến đều có trong mẫu.
  • Trong các nghiên cứu quan sát với các biến liên tục, mỗi quan sát rất có thể nhận được các giá trị duy nhất cho tất cả các biến và do đó không có khả năng tồn tại hai yếu tố với tất cả các biến bằng nhau ngoại trừ một biến.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.