Đầu tiên, nó chỉ là một quip và không chính xác. Google có rất nhiều nhà thống kê rất tài năng, chuyên gia phục hồi thông tin, nhà ngôn ngữ học, nhà kinh tế học, một số nhà tâm lý học và những người khác. Những người này dành nhiều thời gian để giáo dục rất nhiều người không thống kê về sự khác biệt giữa mối tương quan và mối quan hệ nhân quả. Cho rằng đó là một tổ chức lớn, có thể có túi, thậm chí túi lớn, thiếu hiểu biết, nhưng khẳng định chắc chắn là sai. Hơn nữa, rất nhiều nền giáo dục đó phải đối mặt với khách hàng, đặc biệt là các nhà quảng cáo.
Câu trả lời sâu sắc hơn: Sự khác biệt là vô cùng quan trọng. Chỉ cần nhìn vào xếp hạng kết quả tìm kiếm và cho phép tôi mở rộng ra ngoài "tương quan" để bao gồm các biện pháp tương tự, chức năng cho điểm, v.v. Một số trang được đo lường là kết quả tốt cho một số truy vấn nhất định. Chúng có nhiều tính năng dự đoán rất quan trọng đối với thứ hạng của chúng. Ngược lại với các trang tốt có kết quả tốt cho các truy vấn này là một tập hợp các trang web là các trang có kết quả rất tệ cho cùng một truy vấn. Tuy nhiên, những người tạo ra những trang đó đã dành rất nhiều nỗ lực để làm cho chúng trông giống như những trang tốt theo quan điểm số, chẳng hạn như kết hợp văn bản, liên kết internet, v.v. Tuy nhiên, chỉ vì các trang này "tương tự" với các trang tốt không có nghĩa là trên thực tế, đây là những trang tốt. Do đó, Google đã đầu tư và sẽ tiếp tục đầu tư rất nhiều nỗ lực để xác định những tính năng hợp lý nào phân biệt (riêng biệt) trang tốt và xấu.
Điều này không hoàn toàn tương quan và quan hệ nhân quả, nhưng nó sâu sắc hơn thế. Các trang tốt cho một số truy vấn nhất định có thể ánh xạ vào một không gian số nơi chúng xuất hiện tương tự và khác biệt với nhiều trang không liên quan hoặc xấu, nhưng chỉ vì các kết quả nằm trong cùng một vùng của không gian tính năng không có nghĩa là chúng đến từ cùng một tập hợp con "chất lượng cao" của trang web.
Câu trả lời đơn giản hơn: Một viễn cảnh rất đơn giản là giải quyết thứ hạng của kết quả. Kết quả tốt nhất nên là đầu tiên, nhưng chỉ vì thứ gì đó được xếp hạng đầu tiên không có nghĩa đó là kết quả tốt nhất. Theo một số số liệu về tính điểm, bạn có thể thấy rằng xếp hạng của Google tương quan với tiêu chuẩn vàng về đánh giá chất lượng, nhưng điều đó không có nghĩa là xếp hạng của họ ngụ ý rằng kết quả thực sự theo thứ tự này về chất lượng và mức độ phù hợp.
Cập nhật (câu trả lời thứ ba): Theo thời gian, có một khía cạnh khác ảnh hưởng đến tất cả chúng ta: đó là kết quả hàng đầu của Google có thể được coi là có thẩm quyền, bởi vì đó là kết quả hàng đầu trên Google. Mặc dù phân tích liên kết (ví dụ: "PageRank" - một phương pháp để phân tích liên kết) là một nỗ lực phản ánh sự cho phép nhận thức, theo thời gian, các trang mới về một chủ đề có thể đơn giản củng cố cấu trúc liên kết đó bằng cách liên kết với kết quả hàng đầu trên Google. Một trang mới có thẩm quyền hơn có vấn đề với phần đầu liên quan đến kết quả đầu tiên. Vì Google muốn cung cấp trang phù hợp nhất hiện nay , một loạt các yếu tố, bao gồm cả hiện tượng được gọi là "giàu làm giàu", phát sinh do ảnh hưởng ngầm của mối tương quan đối với quan hệ nhân quả.
Cập nhật (câu trả lời thứ tư): Tôi nhận ra (đối với một bình luận bên dưới) rằng có thể hữu ích khi đọc Allegory of the Cave của Plato để hiểu cách giải thích mối tương quan và nguyên nhân như là kết quả của "phản xạ / dự đoán" của thực tế & cách chúng tôi (hoặc máy móc của chúng tôi) nhận thức nó. Tương quan, bị giới hạn nghiêm ngặt trong Tương quan của Pearson, quá hạn chế như một cách giải thích về vấn đề liên kết hiểu lầm (rộng hơn là chỉ tương quan) và quan hệ nhân quả.