Hồi quy với cỡ mẫu rất nhỏ


9

Tôi muốn chạy hồi quy với 4 đến 5 biến giải thích, nhưng tôi chỉ có 15 quan sát. Không thể giả sử các biến này được phân phối bình thường, có phương pháp hồi quy không tham số hoặc bất kỳ phương pháp hồi quy hợp lệ nào khác không?


5
Không có giả định rằng bất kỳ biến giải thích nào là bình thường. Không có giả định về phân phối biên của phản hồi. Nếu bạn đang thực hiện các bài kiểm tra giả thuyết hoặc giả thuyết, suy luận thông thường sẽ thừa nhận tính quy phạm có điều kiện của câu trả lời. Quan trọng hơn là các giả định về tuyến tính và phương sai không đổi. Phản hồi của bạn bao gồm những gì (/ tại sao nó không bình thường)?
Glen_b -Reinstate Monica

3
Không. Bạn không có đủ dữ liệu. Đây là phân tích thăm dò. Bạn cũng có thể thấy các mối quan hệ gợi ý. Nhưng bạn nên tránh giá trị p, khoảng tin cậy và kiểm tra giả thuyết.
charles

Câu trả lời:


10

@Glen_b nói đúng về bản chất của giả định quy tắc trong hồi quy 1 .

Tôi nghĩ vấn đề lớn hơn của bạn là bạn không có đủ dữ liệu để hỗ trợ 4 đến 5 biến giải thích. Nguyên tắc chuẩn của ngón tay cái 2 là bạn nên có ít nhất 10 dữ liệu cho mỗi biến giải thích, tức là 40 hoặc 50 dữ liệu trong trường hợp của bạn (và điều này là cho các tình huống lý tưởng khi không có bất kỳ câu hỏi nào về các giả định). Bởi vì mô hình của bạn sẽ không bão hòa hoàn toàn 3(bạn có nhiều dữ liệu hơn các tham số phù hợp), bạn có thể lấy ước tính tham số (độ dốc, v.v.) và trong các trường hợp lý tưởng, các ước tính không thiên vị không thiên vị. Tuy nhiên, nhiều khả năng các ước tính của bạn sẽ ở rất xa so với các giá trị thực và SE / CI của bạn sẽ rất lớn, do đó bạn sẽ không có sức mạnh thống kê. Lưu ý rằng việc sử dụng phân tích hồi quy không phân tích hoặc thay thế khác, sẽ không giúp bạn thoát khỏi vấn đề này.

Những gì bạn sẽ cần làm ở đây là chọn một biến giải thích duy nhất (trước khi xem dữ liệu của bạn!) Dựa trên các lý thuyết trước đó trong lĩnh vực của bạn hoặc linh cảm của bạn, hoặc bạn nên kết hợp các biến giải thích của mình. Một chiến lược hợp lý cho tùy chọn thứ hai là chạy phân tích thành phần chính (PCA) và sử dụng thành phần nguyên tắc đầu tiên làm biến giải thích của bạn.

Tài liệu tham khảo:
1. Điều gì xảy ra nếu phần dư được phân phối bình thường nhưng Y thì không?
2. Quy tắc ngón tay cái cho cỡ mẫu tối thiểu cho hồi quy bội
3. Số lượng biến độc lập tối đa có thể được nhập vào phương trình hồi quy bội

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.