Tôi có thể sử dụng nhiều hồi quy khi tôi có các yếu tố dự đoán phân loại và liên tục không?


12

Có vẻ như bạn có thể sử dụng mã hóa cho một biến phân loại, nhưng tôi có hai biến dự báo phân loại và một biến liên tục. Tôi có thể sử dụng nhiều hồi quy cho điều này trong SPSS không và nếu có thì như thế nào? cảm ơn!


Tôi chắc chắn bạn có thể , nhưng tôi sợ tôi không biết làm thế nào !
vào

Tôi sẽ đề nghị nhập một cái gì đó như hồi quy vào tài liệu trợ giúp đi kèm với SPSS. Nên là bánh mì và bơ cho bất kỳ gói số liệu thống kê nào
xác suất

Tôi không biết ý của bạn là gì khi mã hóa cho một biến phân loại. Bạn có thể đưa ra một ví dụ trong cú pháp? Là biến phụ thuộc của bạn liên tục hoặc phân loại?
Andy W

Câu trả lời:


8
  1. Nếu đây là câu hỏi cú pháp SPSS, câu trả lời chỉ là đặt biến phân loại, được mã hóa phù hợp, vào danh sách biến cho "biến độc lập" cùng với biến liên tục.
  2. Trên thống kê: Là biến nhị phân biến của bạn? Nếu vậy, bạn cần sử dụng một hình nộm hoặc mã tương phản hợp lệ khác. Nếu nó không phải là nhị phân, thì biến phân loại của bạn là thứ tự hay danh nghĩa? Nếu danh nghĩa, sau đó, một lần nữa, bạn phải sử dụng một số chiến lược mã tương phản - thực hiện mô hình hóa tác động của từng cấp độ của biến đối với kết quả hoặc biến "phụ thuộc". Nếu biến phân loại là thứ tự, thì rất có thểđiều hợp lý để làm là nhập nó vào mô hình, giống như bạn làm với biến dự báo liên tục (nghĩa là "độc lập"). Trong trường hợp đó, bạn sẽ giả sử rằng các mức tăng giữa các cấp của biến dự báo phân loại ("độc lập"); chỉ hiếm khi đây là một sai lầm, nhưng khi có, bạn nên sử dụng lại mã tương phản & mô hình hóa tác động của từng cấp độ. Câu hỏi này đi lên trong diễn đàn này khá thường xuyên - đây là một tốt analaysis
  3. Theo tôi, làm thế nào để xử lý dữ liệu bị thiếu là một vấn đề hoàn toàn riêng biệt. Hiểu biết của tôi là xóa cặp không được xem là một cách tiếp cận hợp lệ cho hồi quy đa biến. Listwise là khá phổ biến nhưng cũng có thể sai lệch kết quả & chắc chắn là một sự xấu hổ. Đa nhiệm là một điều của vẻ đẹp.

Tôi có một câu hỏi cho DMK38. Ở trên bạn viết rằng bạn có thể thêm một biến phân loại vào một mô hình như hiện tại khi nó là thứ tự. Tôi rất vui khi đọc nó ;-) Bạn có một nguồn tốt đề cập đến điều đó để tôi có thể thêm nó vào bài viết của mình không? Cảm ơn bạn rất nhiều vì câu trả lời của bạn! Lilian
Lilian Jans-Beken

1
@ LilianJans-Beken: Xem Biến phụ thuộc liên tục với biến độc lập thứ tự & hồi quy logistic và biến độc lập thứ tự . Bạn có thể không muốn sử dụng các phương pháp phức tạp hơn nhưng hãy lưu ý rằng ngay cả khi bạn vui lòng coi công cụ dự đoán là chia tỷ lệ, việc buộc nó có mối quan hệ tuyến tính với phản hồi là không cần thiết. Và đừng cảm thấy bắt buộc phải có khoảng thời gian bằng nhau giữa các mức tiếp giáp nếu điều gì đó khác có vẻ hợp lý hơn.
Scortchi - Tái lập Monica


2

Bạn chắc chắn có thể, bằng cách làm theo cùng một phương pháp bạn sử dụng cho công cụ dự đoán phân loại đầu tiên. Tạo các biến giả giống như bạn làm cho biến đầu tiên như vậy. Nhưng nó thường dễ sử dụng lệnh Unianova của SPSS. Bạn có thể tra cứu điều này trong bất kỳ Hướng dẫn cú pháp được in hoặc pdf nào hoặc bạn có thể truy cập nó thông qua Phân tích ... Mô hình tuyến tính chung ... Không biến đổi.

Mặc dù phức tạp hơn một chút, lệnh Regression có một số lợi thế so với Unianova. Vấn đề chính là bạn có thể chọn 'thiếu cặp đôi' (bạn không phải thua kiện đơn giản vì nó thiếu giá trị cho một hoặc hai yếu tố dự đoán). Bạn cũng có thể nhận được nhiều chẩn đoán có giá trị như lô một phần và thống kê ảnh hưởng.


1
@ rolando - câu trả lời tốt. Điều đó đang được nói, thiếu các cách tiếp cận cặp đôi có xu hướng nhầm lẫn giữa việc so sánh các hiệu ứng, vì chúng dựa trên số lượng quan sát khác nhau. Có thể là một cái gì đó để ghi nhớ.
richiemorrisroe

Tôi nghĩ rằng bạn hơi bối rối, thiếu khôn ngoan theo cặp chỉ quan trọng nếu bạn chạy các mô hình hoàn toàn riêng biệt (chẳng hạn như sử dụng quy trình lựa chọn mô hình theo từng bước). Nếu bạn nhập tất cả các biến vào mô hình, nó vẫn giảm các giá trị thiếu trong danh sách.
Andy W

@ richiemorrisroe - Tôi đồng ý, đáng ghi nhớ. @ Andy W - Chỉ cần xác nhận trong SPSS rằng, chỉ sử dụng mục nhập bắt buộc, thiếu cặp đôi và thiếu theo chiều kim loại cho kết quả khác nhau về mọi khía cạnh, bao gồm cả df khác nhau.
rolando2

Tôi vẫn nghĩ bạn bối rối, làm thế nào SPSS có thể trả về các bộ kết quả khác nhau bằng cách khai báo bị thiếu theo cặp trừ khi nó tạo ra các giá trị cho dữ liệu bị thiếu? Dưới đây là một ví dụ sử dụng dữ liệu mô phỏng mà tôi đã đăng trong tệp văn bản, dl.dropbox.com/u/3385251/SPSS_missing_Listwise_vs_Pairwise.txt . Tôi hiện đã đánh giá thấp câu trả lời của bạn, vì tất cả những điều này nói về cách lệnh hồi quy xử lý dữ liệu bị thiếu là khó hiểu, không liên quan gì đến câu hỏi ban đầu của OP và có khả năng gây hiểu nhầm.
Andy W

1

Một cách đơn giản để biến các biến phân loại thành một tập hợp các biến giả để sử dụng trong các mô hình trong SPSS là sử dụng cú pháp lặp lại. Đây là cách đơn giản nhất để sử dụng nếu các biến phân loại của bạn theo thứ tự số.

*making vector of dummy variables.
vector dummy(3,F1.0).
*looping through dummy variables using do repeat, in this example category would be the categorical variable to recode. 
do repeat dummy = dummy1 to dummy3 /#i = 1 to 3.
compute dummy = 0.
if category = #i dummy = 1.
end repeat.
execute. 

Nếu không, bạn có thể chỉ cần chạy một tập hợp các câu lệnh if để tạo các biến giả. Phiên bản hiện tại của tôi (16) không có khả năng tự động chỉ định một tập hợp các biến giả trong lệnh hồi quy (giống như bạn có thể trong Stata bằng lệnh xi ) nhưng tôi sẽ không ngạc nhiên nếu điều này có sẵn trong một số phiên bản mới hơn. Cũng lưu ý đến điểm số 2 của dmk38, sơ đồ mã hóa này giả định các danh mục danh nghĩa. Nếu biến của bạn là thứ tự tùy ý hơn có thể được sử dụng.

Tôi cũng đồng ý với dmk38 và cuộc nói chuyện về hồi quy sẽ tốt hơn vì khả năng xác định dữ liệu bị thiếu theo cách cụ thể là một vấn đề hoàn toàn riêng biệt.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.