Không có vấn đề với việc sử dụng từ "dự đoán".
Điều quan trọng là nhận ra rằng các dự đoán không liên quan đến quan hệ nhân quả. Hãy xem xét một trường hợp mà hầu hết những người chết trong phòng cấp cứu của bệnh viện đều chết vì đau tim. Nếu bạn nghe nói rằng một bệnh nhân đã chết, nhưng không biết nguyên nhân, bạn có thể dự đoán rằng đó có thể là do một cơn đau tim, bởi vì bạn biết rằng các cơn đau tim chịu trách nhiệm cho> 50%. Bạn đang đưa ra một dự đoán, nhưng bạn đang dự đoán một nguyên nhân chưa biết từ một hiệu ứng đã biết. Ngoài ra, dự đoán trong ví dụ này là phân loại, do đó, nó tương tự như hồi quy logistic. (Sự tương tự có lẽ mạnh hơn đối với hồi quy logistic đa phương, nhưng điều đó không quan trọng ở đây.)
Đối với những gì nó có giá trị, dự đoán không phải liên quan đến bất kỳ kết nối nhân quả trực tiếp nào cả. Bạn có thể đưa ra dự đoán dựa trên mối tương quan giả, miễn là mối quan hệ này đáng tin cậy. Cân nhắc dự đoán chiều cao chưa biết của một cặp sinh đôi giống hệt nhau dựa trên anh chị em sinh đôi. Trong trường hợp này, cả hai chiều cao là tác động của một tập hợp các nguyên nhân phổ biến (di truyền và môi trường chung). Chiều cao của cả hai không phải là một nguyên nhân hoặc ảnh hưởng của người khác. Tuy nhiên, bạn có thể dự đoán rất tốt trong tình huống này.