Làm thế nào để đối phó với câu hỏi khảo sát với nhiều câu trả lời?


10

Tôi có một bộ dữ liệu hỏi mọi người rằng họ đã từng đến một nơi nào đó (ví dụ A, B, C, D) và họ có thể đưa ra nhiều lựa chọn, sau đó lấy một mẫu từ mũi của họ để xem họ có bị nhiễm một số dịch bệnh.

Tôi cần phải tìm ra nguy cơ tương đối của việc bị lây nhiễm khi đi đến một nơi nhất định, tôi chỉ có thể nghĩ về hồi quy logistic ngay bây giờ, có đề xuất nào khác không?

Cảm ơn.

Câu trả lời:


2

Bạn vẫn có thể sử dụng hồi quy logistic vì kết quả của bạn là phân đôi, bị nhiễm và không bị nhiễm. Tôi chỉ đơn giản là thực hiện một cách tiếp cận biến giả và không sử dụng du lịch làm danh mục tham chiếu (tức là với mỗi địa điểm của bạn, bạn có một biến được mã hóa là 1 nếu họ truy cập địa điểm đó và mã hóa thành 0 nếu họ không truy cập địa điểm đó). Như vậy, nếu bạn chuyển đổi các hệ số beta của mình thành tỷ lệ cược (nghĩa là lũy thừa tỷ lệ cược log), việc giải thích biến giả cho vị trí A sẽ là tỷ lệ chênh lệch của vị trí A không truy cập vị trí A kiểm soát cho các địa điểm khác mà một vị trí đã truy cập. Cũng lưu ý trong cách tiếp cận đa cộng tuyến này là một mối quan tâm (ví dụ: nếu nhiều người đi du lịch đến A cũng đi du lịch đến B thì điều đó có thể sai lệch từng hệ số của họ).


5
Mô hình này giả định rằng phản hồi là một chức năng phụ gia của việc đi đến từng nơi, điều này rất khó xảy ra. Nó vẫn có thể được thực hiện để làm việc bằng cách bao gồm các điều khoản tương tác. Có thể cần một bộ đầy đủ tất cả các tương tác có thể (ngoài các tương tác hai chiều). (Điều đó sẽ giống hệt nhau về mặt toán học khi cung cấp một hình nộm riêng cho từng kết hợp điểm đến có thể.)
whuber

4
Tốt hơn là có nhiều dữ liệu nếu bạn sử dụng tất cả các tương tác (15 tham số) thay vì chỉ các hiệu ứng chính (4 tham số) ...
Stephan Kolassa

@whuber và @Stephen, Cảm ơn bạn đã phản hồi và tôi hoàn toàn đồng ý với từng bạn. Cá nhân tôi sẽ ổn với cách tiếp cận biến giả hiệu ứng chính nếu nhiều câu trả lời không phổ biến, đó có thể không phải là một giả định có thể sử dụng được với những lo ngại về áp phích ban đầu. Tôi có thể đề xuất các thiết kế khác nếu người đăng ban đầu quan tâm đến rủi ro khi đi đến A vs B (chẳng hạn như một số loại thủ tục khớp). Và tôi đồng ý rằng rủi ro phụ gia không có ý nghĩa gì ngoại trừ nếu một số sai lệch lựa chọn đang xảy ra.
Andy W
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.