Các công cụ tìm kiếm đang ngày càng được dựa vào như những người gác cổng thông tin, tuy nhiên các tiêu chí được sử dụng bởi các công cụ tìm kiếm để xếp hạng kết quả là không rõ ràng đối với người dùng. Làm thế nào người dùng có thể chắc chắn rằng kết quả của họ không bị sai lệch hoặc bị can thiệp theo một cách nào đó để có lợi cho một số lợi ích với chi phí chất lượng kết quả tìm kiếm?
Chính phủ thường xuyên yêu cầu các nhà cung cấp dịch vụ tìm kiếm loại bỏ hoặc hạ thấp thứ hạng của các trang web được coi là không mong muốn về mặt chính trị. Các doanh nghiệp có thể trả tiền cho các nhà cung cấp để tăng kết quả nhất định so với những người khác để tăng doanh thu của họ. Tường lửa có thể can thiệp vào kết quả trước khi chúng được truyền lại cho người dùng.
Ngay cả những thay đổi dường như vô hại đối với các thuật toán xếp hạng có vẻ không bị sai lệch, thực sự có thể được thiết kế lệch lạc để gây hại cho các trang web có chung một số thuộc tính chung (không liên quan đến chất lượng thực tế).
Có thể phát hiện sai lệch của công cụ tìm kiếm, bằng cách nói kết quả giám sát trong một khoảng thời gian và đánh giá xem một số "biến ẩn" (có thể là liên kết chính trị) có phải là yếu tố thúc đẩy thay đổi thứ hạng trang web không?
Một nhà cung cấp lén lút có thể dần dần hạ thấp thứ hạng của các trang web được nhắm mục tiêu (và có lẽ các trang web ngẫu nhiên cũng để đánh lạc hướng người dùng). Các giới hạn về mức độ thiên vị mà một nhà cung cấp có thể giới thiệu mà không phát hiện là gì? Hoặc có thể luôn che giấu sự can thiệp đó bằng cách chọn sai các tiêu chí xếp hạng có trọng số mà tình cờ tạo ra kết quả mong muốn (bằng cách "rình mò dữ liệu").
Có bất kỳ thay đổi này nếu tiêu chí xếp hạng được công khai? Chúng ta có cần nguồn mở mà các công cụ tìm kiếm sử dụng không?
Điều này nhắc nhở tôi về kết quả phát hiện xem một công cụ tài chính phức tạp như CDO có bị người bán giả mạo hay không tương đương với việc giải quyết vấn đề sơ đồ dày đặc nhất:
http://www.cs.princeton.edu/~rongge/derivative.pdf
Cảm ơn!