Đây là một truy vấn tương quan gần đây của Google:
http://www.google.com/trends/correlate/search?e=iNET+usage&t=weekly#
Như bạn có thể thấy trong hộp tìm kiếm tại liên kết đó, tôi đã nhập "sử dụng internet" và Google đã làm phần còn lại. Nó hiển thị giá trị 0,9298 là "tương quan" với truy vấn "khai thác dữ liệu". Tuy nhiên, khi tôi đọc trang 2 của sách trắng Google [PDF] , nó nói:
The objective of Google Correlate is to surface the queries in the database whose spatial or temporal pattern is most highly correlated with a target pattern. Google Correlate employs a novel approximate nearest neighbor (ANN) algorithm over millions of candidate queries in an online search tree to produce results similar to the batch-based approach employed by Google Flu Trends but in a fraction of a second. For additional details, please see the Methods section below....
Vì vậy, câu hỏi của tôi là:
Google có sử dụng tương quan Pearson hoặc Spearman bình thường để tìm nội dung này hay họ đang sử dụng thứ gì khác? Nếu vậy, bạn có thể giải thích các kỹ thuật chung?
==================
Ngoài ra, lưu ý trong cốt truyện rằng việc tìm kiếm "sử dụng internet" (và "khai thác dữ liệu") giảm trong những tháng mùa hè và thực sự lặn trong dịp Giáng sinh. Tôi đoán rằng những đứa trẻ và bài tập về nhà của chúng có liên quan đến điều này.