Mẹ tôi đang tham gia một số khóa học trực tuyến để trở thành một thủ thư về các loại, trong khóa học này họ bao gồm các tìm kiếm boolean, vì vậy họ có thể tìm kiếm cơ sở dữ liệu một cách hiệu quả, tuy nhiên, bà có một câu hỏi nghe giống như thế này:
Tìm kiếm "x HOẶC y" sẽ cho kết quả 105 000 lượt truy cập, trong khi tìm kiếm chỉ x sẽ cho kết quả 80 000 lượt truy cập và tìm kiếm chỉ y sẽ nhận được 35 000 lượt truy cập. Tại sao tìm kiếm "x HOẶC y" cho 105 000 lượt truy cập, khi các tìm kiếm riêng lẻ kết hợp cho 115 000 lượt truy cập?
Đối với tôi điều này nghe có vẻ lạ, vì vậy tôi đã tự mình kiểm tra điều này, bằng cách sử dụng các từ thịt xông khói và bánh sandwich .
- Chỉ có thịt xông khói mang lại kết quả 179 000 000
- Chỉ có bánh sandwich mang lại kết quả 312 000 000
- thịt xông khói OR sandwich cho 491 000 000 kết quả
Nhưng đối với tôi, nó cộng lại: 179 000 000 (thịt xông khói) + 312 000 000 (bánh sandwich) = 491 000 000 (thịt xông khói OR sandwich)
Tại sao một truy vấn OR có thể dẫn đến ít lần truy cập hơn cả hai truy vấn riêng lẻ được kết hợp?