Tôi có cần sử dụng hồi quy đa biến hoặc một số phân tích hồi quy không?


7

Tôi có một bộ dữ liệu gồm 45 người tham gia với 96 biến số (mặc dù một số phép đo bị thiếu). Một số biến đơn giản như tuổi và khuyết tật trong khi các phép đo khác là điểm trên một số bài kiểm tra nhất định (ví dụ: một bài kiểm tra có 5 giá trị là kết quả). Tôi có dữ liệu của 5 bài kiểm tra, được đưa ra trên 3 điểm khác nhau và như đã nêu trước đó đôi khi nhiều điểm cho mỗi bài kiểm tra.

Vì tập dữ liệu quá lớn (với số lượng tính năng ghi được số lượng người tham gia), tôi quyết định dự đoán điểm số trong bài kiểm tra cho tất cả các kết quả trước đó (như tuổi, khuyết tật và tất cả điểm số trong cùng bài kiểm tra trước đó). Vì vậy, về cơ bản, tôi muốn dự đoán 5 tính năng được cung cấp khoảng 10 tính năng trong 45 người tham gia bằng cách sử dụng hồi quy (tôi muốn xem các hệ số chính xác, giá trị p và số đo bình phương R).

Tôi có nên thực hiện hồi quy thường xuyên cho từng tính năng tôi muốn dự đoán hay tôi nên sử dụng hồi quy đa biến trên tất cả các tính năng tôi muốn dự đoán cùng một lúc? Sự khác biệt là gì?


2
+1. Không có sự khác biệt! Hồi quy đa biến chính xác tương đương với một số hồi quy đơn biến riêng biệt.
amip

3
@amoeba: Hầu như! Điều này phụ thuộc vào cấu trúc lỗi của bạn (là đường chéo) và / hoặc tập hợp các biến giải thích cho mỗi mô hình (giống nhau). Ngoài ra, thông thường người ta sử dụng các bình phương tối thiểu lặp để ước tính các mô hình này thay vì OLS đơn giản. X
usεr11852

@ usεr11852: Bạn chắc chắn đúng về cùng các yếu tố dự đoán và lỗi không tương quan. Nhưng tôi không nhận được câu cuối cùng của bạn: bạn có thể giải thích? bình phương tối thiểu lặp lại là gì (trái ngược với OLS) và tại sao người ta lại thích nó cho hồi quy đa biến nhưng không phải là đơn biến? Là nó cho các trường hợp lỗi tương quan? Có lẽ bạn muốn đóng góp một câu trả lời!
amip

1
Vâng, nó là dành cho các trường hợp lỗi tương quan. Nếu không, các OLS riêng biệt sẽ đủ (như bạn đã chỉ ra một cách chính xác).
usεr11852

Câu trả lời:


2

Đặt là vectơ của phản ứng thứ , wehre . Trong ví dụ của bạn là 5 vì bạn có 5 điểm kiểm tra. ChoYiii=1,,rrX là mộtn×pma trận của các yếu tố dự đoán. Nếu bạn thực hiệnr hồi quy riêng (một cho mỗi Yi),

Yi=Xβi+ϵi,

Ở đâu ϵiNn(0,σi2In). Sử dụng OLS, bạn có được ước tính choβ. Bạn cũng có thể thực hiện hồi quy đa biến,

Y=XB+E,

Ở đâu Yn×r ma trận trả lời, Bp×r ma trận các hệ số hồi quy và E là ma trận lỗi sao cho icột thứ, ϵiiidNn(0,σi2In). Trong trường hợp này, ước tính OLS choB tương đương với r Ước tính OLS cho βi.

Tuy nhiên, nếu bạn có lý do để cho rằng có điều kiện X, 5 yếu tố dự đoán tương quan với nhau (có vẻ như đó sẽ là một giả định hợp lý trong trường hợp của bạn), sau đó là các hàng củaE được coi là như vậy mà cho j=1,2,,n,ϵjiidNr(0,Σ). ĐâyΣ bây giờ đại diện cho cấu trúc tương quan cho các yếu tố dự đoán là tốt.

Điều quan trọng cần lưu ý là ngay cả trong trường hợp này, ước tính cho Bgiống như ước tính OLS, nhưng cấu trúc lỗi của các ước tính thay đổi và do đó suy luận về các ước tính thay đổi. Hậu quả làp-giá trị thay đổi.

Gói MRCE R cho phép phù hợp với mô hình như vậy. Gói này cũng sử dụng các phương thức chính quy khin không đủ lớn so với p, vì vậy bạn có thể không bị buộc phải giảm xuống số lượng dự đoán nhỏ hơn. Bạn cũng có thể tìm thấy lý thuyết chi tiết hơn ở đây cùng với các ví dụ động lực. Các tác giả nêu động lực sau đây

Các ứng dụng của mô hình tổng quát này phát sinh trong hóa học, kinh tế lượng, tâm lý học và các ngành định lượng khác trong đó người ta dự đoán nhiều phản ứng với một bộ biến dự đoán. Ví dụ, dự đoán một số thước đo chất lượng giấy với một tập hợp các biến liên quan đến sản xuất của nó.

Tương tự như vậy trong thiết lập của bạn, bạn dường như có 5 bộ phản hồi phát sinh từ cùng một dự đoán, với cấu trúc tương quan vốn có giữa các phản hồi.


Nói "dự đoán là tương quan" có thể bị hiểu sai; những gì tôi đoán bạn có nghĩa là các yếu tố dự đoán có tương quan ngay cả khi có điều kiệnX. (Ngoài ra, "dự đoán" làXvà bạn có thể có nghĩa là "phản hồi"?)
amip

Câu cuối cùng của bạn: nhưng phải làm gì nếu người ta nghĩ rằng tiếng ồn trong các phản hồi có tương quan, nhưng Σlà không biết?
amip

@amoeba ước tính gói Σ (thực ra nó ước tính Ω=Σ1), và giấy tôi đính kèm cũng vậy. Tôi không nhận thức được các kỹ thuật của bài báo, vì vậy không muốn xây dựng quy trình ước tính.
Greenparker
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.