Nhiều câu hỏi tranh luận cho hồi quy bội trong SPSS


9

Tôi hiện đang chạy một mô hình hồi quy bội bằng cách sử dụng dữ liệu được liệt kê và có một vài câu hỏi.

Lý lịch:

Sử dụng SPSS 18. Dữ liệu của tôi dường như là MAR. Việc xóa danh sách các trường hợp khiến tôi chỉ còn 92 trường hợp, nhiều trường hợp để lại 153 trường hợp để phân tích. Tất cả các giả định đã gặp - một bản ghi biến đổi. 9 IV 5 - 5 phân loại, 3 thang đo, 1 khoảng. Quy mô DV. Sử dụng phương pháp enter của hồi quy bội tiêu chuẩn.

  • DV của tôi là sự khác biệt về điểm số giữa điểm số trước và số đo điểm bài, cả hai biến này đều thiếu một số trường hợp - tôi có nên áp dụng các giá trị bị thiếu cho từng điểm này và sau đó tìm ra sự khác biệt giữa chúng để tính DV của tôi (làm thế nào để tôi thực hiện việc này), hoặc tôi có thể chỉ áp đặt dữ liệu cho DV của mình không? Đó là cách tiếp cận phù hợp nhất?
  • Tôi có nên chạy các cuộc tranh luận về dữ liệu được chuyển đổi hoặc dữ liệu sai lệch không được truyền?
  • Tôi có nên nhập tất cả các biến vào quy trình cắt bỏ, ngay cả khi chúng không bị thiếu dữ liệu hay tôi chỉ nên áp đặt dữ liệu cho các biến bị thiếu hơn 10% trường hợp?

Tôi đã chạy hồi quy trên các trường hợp bị xóa theo cách liệt kê và tài khoản IV của tôi có rất ít phương sai trong DV của tôi, sau đó tôi đã chạy hồi quy trên một tệp hoàn chỉnh sau nhiều lần cắt ngang - Kết quả rất giống nhau, trong đó 9 IV của tôi vẫn chỉ dự đoán khoảng 12% phương sai trong DV của tôi, tuy nhiên, bây giờ một trong những IV của tôi chỉ ra rằng nó đang đóng góp đáng kể (điều này xảy ra là một biến được chuyển đổi nhật ký) ...

  • Tôi có nên báo cáo dữ liệu gốc nếu có ít khác biệt giữa các kết luận của mình - tức là IV của tôi dự đoán kém về dv hoặc báo cáo dữ liệu đầy đủ?

"Tỷ lệ" có nghĩa là gì đối với SPSS, nó có đề cập đến dữ liệu thứ tự không?
gung - Phục hồi Monica

Tỷ lệ trong các định dạng SPSS thường có nghĩa là các biện pháp "khoảng / tỷ lệ", xem lệnh VARIABLE LEVEL . Nhưng điều đó sau đó để lại câu hỏi sự khác biệt giữa thang đo 3 và câu hỏi 1 khoảng là gì? Điều đó đang được nói mặc dù điều này sẽ đủ thông tin để giải quyết hiệu quả câu hỏi của bạn.
Andy W

2
Lời khuyên duy nhất tôi có thể đưa ra là dự đoán điểm thay đổi có xu hướng khó hơn nhiều so với dự đoán các mức (vì vậy không có gì đáng ngạc nhiên trong nhiều tình huống R^2xảy ra ở mức thấp ). Xem một số thảo luận tốt đẹp của thiết kế trước bài ở đây . Mặc dù điều đó vẫn hoàn toàn không trả lời câu hỏi của bạn!
Andy W

Câu trả lời:


2
  1. Việc bạn có nên áp đặt cả điểm trước và điểm sau hay điểm chênh lệch hay không, tùy thuộc vào cách bạn phân tích chênh lệch trước khi đăng. Bạn nên lưu ý rằng có những hạn chế chính đáng để phân tích điểm số chênh lệch (xem Edwards, 1994, để đánh giá tốt) và phương pháp hồi quy trong đó bạn phân tích phần dư cho điểm sau khi kiểm soát điểm trước có thể tốt hơn. Trong trường hợp đó, bạn sẽ muốn áp đặt điểm trước và sau, vì đó là các biến sẽ có trong mô hình phân tích của bạn. Tuy nhiên, nếu bạn có ý định phân tích điểm số chênh lệch, hãy tính điểm số chênh lệch, vì không chắc bạn sẽ muốn tính toán điểm số chênh lệch theo cách thủ công trên tất cả các tập dữ liệu bị tranh chấp của bạn. Nói cách khác, bất kỳ (các) biến bạn đang sử dụng trong mô hình phân tích thực tế của bạn,
  2. Một lần nữa, tôi sẽ đánh giá với biến được chuyển đổi, vì đó là những gì được sử dụng trong mô hình phân tích của bạn.
  3. Thêm các biến vào mô hình cắt cụt sẽ làm tăng nhu cầu tính toán của quá trình cắt bỏ, NHƯNG, nếu bạn có thời gian, nhiều thông tin luôn tốt hơn. Các biến có dữ liệu hoàn chỉnh có khả năng là các biến phụ trợ rất hữu ích để giải thích sự thiếu hụt MAR. Nếu sử dụng tất cả các biến của bạn dẫn đến quá nhiều thời gian / tính toán yêu cầu của một mô hình cắt cụt (nghĩa là, nếu bạn có một tập dữ liệu lớn), hãy tạo các biến giả cho mỗi trường hợp thiếu cho từng biến và xem biến hoàn chỉnh nào dự đoán các biến thiếu đó trong logistic các mô hình - sau đó bao gồm các biến trường hợp hoàn chỉnh cụ thể đó trong mô hình cắt cụt của bạn.
  4. Tôi sẽ không báo cáo các phân tích ban đầu (nghĩa là xóa danh sách). Nếu cơ chế thiếu của bạn là MAR, thì MI không chỉ giúp bạn tăng sức mạnh mà còn cung cấp cho bạn ước tính chính xác hơn (Enders, 2010). Do đó, hiệu ứng đáng kể với MI có thể không đáng kể với việc xóa danh sách vì phân tích đó không đủ sức mạnh, sai lệch hoặc cả hai.

Người giới thiệu

Edwards, JR (1994). Phân tích hồi quy như là một thay thế cho điểm số khác biệt. Tạp chí Quản lý , 20 , 683-689.

Kết thúc, CK (2010). Ứng dụng phân tích dữ liệu thiếu . New York, NY: Nhà xuất bản Guilford.


1

Theo kinh nghiệm của tôi, chức năng cắt bỏ của SPSS rất dễ sử dụng, cả trong việc tạo bộ dữ liệu và phân tích và tổng hợp các bộ dữ liệu cắt cụt kết quả. Tuy nhiên, nó dễ sử dụng là sự sụp đổ của nó là tốt. Nếu bạn nhìn vào một chức năng cắt bỏ tương tự trong Rphần mềm thống kê (xem ví dụ về micegói), bạn sẽ thấy nhiều tùy chọn hơn. Xem trang web của Stef van Buurens để biết giải thích tuyệt vời về nhiều trường hợp nói chung (có hoặc không sử dụng gói chuột).

Điều rất quan trọng cần lưu ý là các tùy chọn bổ sung này không phải là lựa chọn 'xa xỉ' chỉ dành cho người dùng cao cấp . Một số là rất cần thiết để đạt được sự đồng nhất thích hợp , các mô hình cụ thể cho các biến bị thiếu cụ thể , các yếu tố dự đoán cụ thể cho các biến bị thiếu cụ thể , chẩn đoán cắt cụ thể và hơn thế nữa, không có sẵn trong chức năng cắt bỏ SPSS.

Đối với câu hỏi của bạn:

  1. việc loại bỏ điểm trước và sau và thay thế một cách thụ động những khác biệt còn thiếu là phù hợp khi bạn muốn bảo tồn mối quan hệ giữa điểm trước và điểm sau và sự khác biệt (như được trả lời bởi jsakaluk). Trong trường hợp của bạn, điều này có thể là như vậy khi bạn muốn xây dựng một mô hình với sự khác biệt về điểm trước và sau là biến kết quả / biến phụ thuộc và đường cơ sở (điểm trước) là (một trong) biến dự đoán / biến độc lập.
  2. Bất kỳ mô hình nào được sử dụng để thay thế các giá trị bị thiếu phải tuân theo các giả định của nó. Có nghĩa là để thay thế một biến liên tục, bạn cần tuân thủ các giả định của mô hình hồi quy tuyến tính (trong trường hợp đơn giản nhất). đối với hồi quy tuyến tính và hầu hết các mô hình hồi quy khác, các biến dự đoán không cần phải được phân phối bình thường, tuy nhiên , phần dư của mô hình phải có! Do đó, một số chuyển đổi có thể là cần thiết nếu sau này là trường hợp.
  3. Xem câu trả lời của jsakaluk. Tuy nhiên, xin lưu ý rằng SPSS sử dụng mức độ lớn , điều đó có nghĩa là tất cả các biến đã nhập được sử dụng để thay thế các biến bằng các trường hợp bị thiếu. Nếu bạn chỉ có một biến bị thiếu thì điều này không có vấn đề gì. Tuy nhiên, nếu bạn có nhiều biến, điều này có nghĩa là các biến bị thiếu cũng được sử dụng để hoàn thành các biến khác bị thiếu. Điều này có thể không phải là một vấn đề, nhưng trong một số trường hợp, điều này tạo ra các vòng phản hồi làm sai lệch các giá trị từ chối cuối cùng của bạn. Điều bắt buộc là phải kiểm tra điều này bằng cách tìm kiếm các xu hướng trong suốt các lần lặp lại của việc thay thế của bạn thay vì 'ổn định' các giá trị thay thế.
  4. Tôi đồng ý với câu trả lời của jsakaluk về điều này. Nếu bạn quyết định 'không tin tưởng' dữ liệu hoàn chỉnh của mình vì bạn nghi ngờ bỏ lỡ có chọn lọc và giải quyết hoặc khắc phục một phần điều này bằng cách sử dụng nhiều kỹ thuật cắt bỏ (mà tôi nghĩ thực sự sẽ ít sai lệch nhất), thì kết quả nhiều lần cắt của bạn sẽ là kết quả chính của bạn chỉ. Đáng tiếc, kinh nghiệm đã cho thấy các nhà phê bình hoặc những người quan tâm khác đôi khi cũng muốn xem các phân tích trường hợp hoàn chỉnh (vì vậy hãy giữ chúng trong tầm tay).
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.