Tôi muốn chạy hồi quy với 4 đến 5 biến giải thích, nhưng tôi chỉ có 15 quan sát. Không thể giả sử các biến này được phân phối bình thường, có phương pháp hồi quy không tham số hoặc bất kỳ phương pháp hồi quy hợp lệ nào khác không?
Tôi muốn chạy hồi quy với 4 đến 5 biến giải thích, nhưng tôi chỉ có 15 quan sát. Không thể giả sử các biến này được phân phối bình thường, có phương pháp hồi quy không tham số hoặc bất kỳ phương pháp hồi quy hợp lệ nào khác không?
Câu trả lời:
@Glen_b nói đúng về bản chất của giả định quy tắc trong hồi quy 1 .
Tôi nghĩ vấn đề lớn hơn của bạn là bạn không có đủ dữ liệu để hỗ trợ 4 đến 5 biến giải thích. Nguyên tắc chuẩn của ngón tay cái 2 là bạn nên có ít nhất 10 dữ liệu cho mỗi biến giải thích, tức là 40 hoặc 50 dữ liệu trong trường hợp của bạn (và điều này là cho các tình huống lý tưởng khi không có bất kỳ câu hỏi nào về các giả định). Bởi vì mô hình của bạn sẽ không bão hòa hoàn toàn 3(bạn có nhiều dữ liệu hơn các tham số phù hợp), bạn có thể lấy ước tính tham số (độ dốc, v.v.) và trong các trường hợp lý tưởng, các ước tính không thiên vị không thiên vị. Tuy nhiên, nhiều khả năng các ước tính của bạn sẽ ở rất xa so với các giá trị thực và SE / CI của bạn sẽ rất lớn, do đó bạn sẽ không có sức mạnh thống kê. Lưu ý rằng việc sử dụng phân tích hồi quy không phân tích hoặc thay thế khác, sẽ không giúp bạn thoát khỏi vấn đề này.
Những gì bạn sẽ cần làm ở đây là chọn một biến giải thích duy nhất (trước khi xem dữ liệu của bạn!) Dựa trên các lý thuyết trước đó trong lĩnh vực của bạn hoặc linh cảm của bạn, hoặc bạn nên kết hợp các biến giải thích của mình. Một chiến lược hợp lý cho tùy chọn thứ hai là chạy phân tích thành phần chính (PCA) và sử dụng thành phần nguyên tắc đầu tiên làm biến giải thích của bạn.
Tài liệu tham khảo:
1. Điều gì xảy ra nếu phần dư được phân phối bình thường nhưng Y thì không?
2. Quy tắc ngón tay cái cho cỡ mẫu tối thiểu cho hồi quy bội
3. Số lượng biến độc lập tối đa có thể được nhập vào phương trình hồi quy bội