Tôi có dữ liệu rượu từ đây bao gồm 11 biến độc lập số với xếp hạng phụ thuộc được liên kết với mỗi mục có giá trị từ 0 đến 10. Điều này làm cho nó trở thành một bộ dữ liệu tuyệt vời để sử dụng mô hình hồi quy để điều tra mối quan hệ giữa các biến và liên kết Xếp hạng. Tuy nhiên, liệu hồi quy tuyến tính có phù hợp không, hay tốt hơn là sử dụng hồi quy logistic đa biến / có trật tự?
Hồi quy logistic có vẻ tốt hơn khi đưa ra các danh mục cụ thể, nghĩa là không phải là biến phụ thuộc liên tục nhưng (1) có 11 danh mục (hơi nhiều?) Và (2) khi kiểm tra, chỉ có dữ liệu cho 6-7 loại đó, tức là còn lại 5-4 loại không có ví dụ trong bộ dữ liệu.
Mặt khác, hồi quy tuyến tính nên ước tính tuyến tính xếp hạng trong khoảng 0-10, có vẻ gần với những gì tôi đang cố gắng tìm hiểu; nhưng biến phụ thuộc không liên tục trong tập dữ liệu.
Đó là cách tiếp cận tốt hơn? Lưu ý: Tôi đang sử dụng R để phân tích
Chỉnh sửa, giải quyết một số điểm được đề cập trong câu trả lời:
- Không có mục tiêu kinh doanh vì đây thực sự là một khóa học đại học. Nhiệm vụ là phân tích một bộ dữ liệu về sự lựa chọn bất cứ cách nào tôi thấy phù hợp.
- Phân phối xếp hạng có vẻ bình thường (biểu đồ / qq-lô). Các giá trị thực tế trong bộ dữ liệu nằm trong khoảng từ 3-8 (mặc dù về mặt kỹ thuật là 0-10).