Thông thường, một nhà phân tích thống kê được trao một bộ dữ liệu tập hợp và được yêu cầu điều chỉnh mô hình bằng cách sử dụng một kỹ thuật như hồi quy tuyến tính. Rất thường xuyên bộ dữ liệu được kèm theo từ chối trách nhiệm tương tự như "Ồ đúng rồi, chúng tôi đã nhầm lẫn khi thu thập một số điểm dữ liệu này - hãy làm những gì bạn có thể".
Tình huống này dẫn đến sự phù hợp với hồi quy bị ảnh hưởng nặng nề bởi sự hiện diện của các ngoại lệ có thể là dữ liệu sai. Đưa ra những điều sau đây:
Thật nguy hiểm từ cả hai quan điểm khoa học và đạo đức khi vứt bỏ dữ liệu mà không có lý do nào khác ngoài việc "làm cho sự phù hợp trở nên tồi tệ".
Trong cuộc sống thực, những người thu thập dữ liệu thường không có sẵn để trả lời các câu hỏi như "khi tạo bộ dữ liệu này, chính xác thì điểm nào đã làm bạn bối rối?"
Những kiểm tra thống kê hoặc quy tắc của ngón tay cái có thể được sử dụng làm cơ sở để loại trừ các ngoại lệ trong phân tích hồi quy tuyến tính?
Có bất kỳ cân nhắc đặc biệt cho hồi quy đa tuyến?