Trong một tập dữ liệu của hai quần thể không chồng chéo (bệnh nhân và khỏe mạnh, tổng ) tôi muốn tìm (trong số biến độc lập) các yếu tố dự báo quan trọng cho biến phụ thuộc liên tục. Tương quan giữa các yếu tố dự đoán là hiện tại. Tôi quan tâm đến việc tìm hiểu xem có bất kỳ yếu tố dự đoán nào có liên quan đến biến phụ thuộc "trong thực tế" không (thay vì dự đoán biến phụ thuộc càng chính xác càng tốt). Khi tôi bị choáng ngợp với vô số cách tiếp cận có thể, tôi muốn hỏi cách tiếp cận nào được khuyến nghị nhất.
Từ bao gồm từng bước hiểu biết của tôi hoặc loại trừ các nhân tố ảnh được không được khuyến khích
Ví dụ: chạy hồi quy tuyến tính riêng cho mọi yếu tố dự đoán và giá trị p chính xác cho nhiều so sánh bằng FDR (có thể rất bảo thủ?)
Hồi quy thành phần chính: khó diễn giải vì tôi sẽ không thể nói về sức mạnh dự đoán của các yếu tố dự đoán riêng lẻ mà chỉ về các thành phần.
bất cứ một đề nghị nào khác?