Đây có lẽ không phải là một điều tốt để làm. Trước tiên, xem xét tất cả các đồng biến riêng lẻ, sau đó xây dựng một mô hình với các mô hình có ý nghĩa tương đương về mặt logic với quy trình tìm kiếm tự động. Mặc dù cách tiếp cận này là trực quan, các suy luận được thực hiện từ quy trình này không hợp lệ (ví dụ: các giá trị p thực sự khác với các giá trị được báo cáo bởi phần mềm). Vấn đề được phóng đại kích thước của tập hợp số ban đầu là lớn hơn. Nếu bạn làm điều này bằng mọi cách (và thật không may, nhiều người làm), bạn không thể coi mô hình kết quả là nghiêm túc. Thay vào đó, bạn phải chạy một nghiên cứu hoàn toàn mới, thu thập một mẫu độc lập và phù hợp với mô hình trước đó, để kiểm tra nó. Tuy nhiên, điều này đòi hỏi rất nhiều tài nguyên, và hơn nữa, vì quy trình này còn thiếu sót và mô hình trước đó có thể là một mô hình kém,lãng phí rất nhiều tài nguyên.
Một cách tốt hơn là đánh giá các mô hình quan tâm thực sự với bạn. Sau đó, sử dụng một tiêu chí thông tin xử phạt tính linh hoạt của mô hình (như AIC) để phân xử giữa các mô hình đó. Đối với hồi quy logistic, AIC là:
AIC=−2×ln(likelihood)+2k
Trong đó là số lượng đồng biến có trong mô hình đó. Bạn muốn mô hình có giá trị nhỏ nhất cho AIC, tất cả mọi thứ đều bằng nhau. Tuy nhiên, nó không phải lúc nào cũng đơn giản; hãy cảnh giác khi một số mô hình có các giá trị tương tự cho AIC, mặc dù một mô hình có thể thấp nhất. k
Tôi bao gồm công thức hoàn chỉnh cho AIC ở đây, vì các phần mềm khác nhau đưa ra thông tin khác nhau. Bạn có thể phải tính toán nó từ khả năng, hoặc bạn có thể nhận được AIC cuối cùng, hoặc bất cứ điều gì ở giữa.