Giả sử tôi đang chạy hồi quy trong đó biến phụ thuộc của tôi là giết người và biến quan tâm của tôi là truy cập vào các trò chơi video bạo lực. Giả sử tôi cũng ném vào bồn rửa trong bếp liên quan đến các biến kiểm soát của mình-- Tôi có 38 điều khiển nhân khẩu học, 30 điều khiển tội phạm có thể có hoặc không có liên quan, v.v. Một số điều khiển này thậm chí có thể chứa dữ liệu mờ hoặc xấu (lỗi đánh máy, ô trống, v.v.). Một số hậu quả tiêu cực của các hồi quy cẩu thả là gì?
Tôi được một sinh viên tốt nghiệp ngành Thống kê cho biết rằng các điều khiển này sẽ không ảnh hưởng đến giá trị p giữa biến phụ thuộc và biến quan tâm, ngay cả khi các hệ số trên các điều khiển sẽ vô nghĩa. Nhưng nếu điều này là đúng, tại sao tất cả các học giả chỉ ném vào bồn rửa trong nhà bếp trong hồi quy của họ? Có thể các giá trị p trở nên nhỏ hơn thông qua việc bổ sung các điều khiển rác không?