Tại sao trên trang đầu tiên Google cho biết có hàng ngàn kết quả nhưng trên trang cuối cùng có ít hơn một trăm?


11

Tại sao trên trang đầu tiên Google cho biết có hàng ngàn kết quả nhưng trên trang cuối cùng có ít hơn một trăm?

Đó là một loại Tìm kiếm Google đệ quy nên tự giải thích. Tôi đã mất một thời gian để điều chỉnh câu và cố gắng tìm một số tương ứng chính xác, lý do tại sao tôi thay đổi nó thành " hàng trăm " thay vào đó! : P

Nếu bạn đã sử dụng Google đủ lâu, bạn chắc chắn đã vấp phải những tình huống tương tự như thế này, nhiều lần. Bất cứ khi nào nó hiển thị dưới 10 trang, thật dễ dàng để xem nó. Vấn đề là: số lượng kết quả trên bất kỳ trang nào ngoại trừ trang cuối cùng có vẻ như là một ước tính khủng khiếp .

Thậm chí còn kỳ quặc hơn, đôi khi ước tính đột nhiên trở nên tốt hơn nhiều và gần như giống hệt nhau trên tất cả các trang so với trên trang cuối cùng - trang duy nhất luôn luôn đúng.

Vậy, có ai biết tại sao không?


1
Ngay bây giờ trên trang một cho tìm kiếm đó, nó cho biết 3200 kết quả, nhưng trên trang cuối cùng có 75 (cho những người quan tâm đến một bản cập nhật)
dkuntz2

@DKuntz là 2990 và 65 đối với tôi (trong khi tôi đăng nhập) trong khi tôi đăng xuất (đó là cách tôi đã làm lần đầu tiên), nó biến thành 3120 và 77. Có lẽ sau này tôi sẽ thay đổi câu hỏi một chút và xây dựng lên một truy vấn đệ quy nhất quán hơn - nhưng bất cứ ai cũng được chào đón để làm điều đó! : P
cregox

Google thật kỳ lạ.
dkuntz2

Của tôi luôn nói 208 kết quả ở trang cuối cho dù đó là 4 trang kết quả hay 22, nó luôn ghi là 208.
mchid

Câu trả lời:


6

Tôi không biết câu trả lời chính xác - có lẽ không ai ngoài Google biết. Nhưng tôi có hai điểm dữ liệu có thể hữu ích.

Đầu tiên là vấn đề của XKCD :

Vì vậy, nó thực sự trông giống như có một ngưỡng nhất định về khối lượng kết quả mà vượt qua đó Google rõ ràng nói rằng vít vít nó ra và ném ra một con số khổng lồ. Tôi tưởng tượng điều này có lẽ là do sự bất tài chứ không phải là sự lừa dối có chủ ý; Tôi chắc chắn khó tạo ra các trang nhanh chóng từ nhiều nguồn và có thể đối với các tìm kiếm có nhiều kết quả, họ không có thời gian để đồng bộ hóa tất cả. Vì vậy, họ fudge các con số. Thực tế là điều này làm cho có vẻ như họ có nhiều kết quả hơn họ có lẽ chỉ là một phần thưởng ngoài ý muốn.

Điểm dữ liệu thứ hai là từ một giáo sư khoa học máy tính mà tôi đã khá tò mò về vấn đề này và đã làm phiền một số người bạn tại Google về nó. Họ nói với anh ta rằng đôi khi nó trở nên rất tốn kém khi tìm ra có bao nhiêu kết quả thực sự được trả về từ một tìm kiếm, vì vậy họ chỉ đoán đúng nhất và trả lại trang kết quả đầu tiên, điều mà hầu hết mọi người quan tâm. Chỉ khi bạn thực sự bắt đầu đi sâu vào các trang, Google mới bận tâm tính toán đầy đủ các trang còn lại.

Vì vậy, đây không phải là một câu trả lời dứt khoát, nhưng hy vọng chúng sẽ hữu ích trong việc giải thích các loại vấn đề có thể gây ra sự thiếu chính xác của Google.

BIÊN TẬP:

Câu trả lời Sathya trên trang này có một câu trả lời từ Google 's Webmaster KB.

Khi bạn thực hiện tìm kiếm, kết quả thường được hiển thị với thông tin: Kết quả 1 - 10 trong khoảng XXXX.

Tính toán của Google về tổng số kết quả tìm kiếm là một ước tính. Chúng tôi hiểu rằng một con số trên sân bóng là có giá trị và bằng cách cung cấp ước tính thay vì một tài khoản chính xác, chúng tôi có thể trả về kết quả tìm kiếm chất lượng nhanh hơn.

Ngoài ra, khi bạn nhấp vào trang kết quả tìm kiếm tiếp theo, tổng số kết quả tìm kiếm có thể thay đổi. Trong trường hợp này, chúng tôi nhận thấy rằng một số kết quả truy vấn là trùng lặp và thu gọn các trùng lặp đó để bạn có thể tìm thấy kết quả cụ thể mà bạn đang tìm kiếm dễ dàng hơn. Thu gọn các bản sao làm giảm số lượng kết quả ước tính, cũng như tổng số trang kết quả.


Trong khi tôi yêu XKCD và các giáo viên cũ thân yêu, điều bạn đang nói với tôi là có lẽ tôi nên hỏi điều này trên stackoverflow.com: P
cregox

Tôi không nghĩ bất cứ ai tại stackoverflow sẽ có câu trả lời dứt khoát - nếu bạn thực sự cần biết, bạn nên hỏi Google. Tôi chỉ có thể chuyển tiếp câu trả lời từ một người đã hỏi Google vài tháng trước.
DSolimano

không tìm kiếm một câu trả lời dứt khoát, chỉ cần một câu giải thích sâu hơn hợp lý, tốt nhất là có nguồn gốc tốt. Đừng hiểu lầm tôi là hợp lý, nhưng nói "bởi vì nó khó" ngay cả khi nó có thẩm quyền và có ý nghĩa, là quá ít đối với tôi. Hmm ... có thể là hoài
nghi.se

Chỉnh sửa tốt, bây giờ đó là nguồn tốt! Mặc dù nó vẫn nói "bởi vì nó khó", điều đó có nghĩa là tôi vẫn hy vọng biết thêm chi tiết. : P
cregox

7

Không - con số chỉ là một xấp xỉ .

Khi bạn thực hiện tìm kiếm, kết quả thường được hiển thị với thông tin: Kết quả 1 - 10 trong khoảng XXXX.

Tính toán của Google về tổng số kết quả tìm kiếm là một ước tính. Chúng tôi hiểu rằng một con số trên sân bóng là có giá trị và bằng cách cung cấp ước tính thay vì một tài khoản chính xác, chúng tôi có thể trả về kết quả tìm kiếm chất lượng nhanh hơn.

Ngoài ra, khi bạn nhấp vào trang kết quả tìm kiếm tiếp theo, tổng số kết quả tìm kiếm có thể thay đổi. Trong trường hợp này, chúng tôi nhận thấy rằng một số kết quả truy vấn là trùng lặp và thu gọn các trùng lặp đó để bạn có thể tìm thấy kết quả cụ thể mà bạn đang tìm kiếm dễ dàng hơn. Thu gọn các bản sao làm giảm số lượng kết quả ước tính, cũng như tổng số trang kết quả.


Tôi nghĩ rằng đây không phải là một hành vi tốt nếu họ luôn giới hạn số lượng kết quả chỉ nhiều hơn hoặc ít hơn 1000. Trong trường hợp người dùng muốn nhiều hơn họ nên hiển thị nhiều hơn. Theo quan điểm của tôi, một số từ khóa phổ biến sẽ trả về số lượng lớn kết quả tìm kiếm (như hoa, sách ...) và tôi nghĩ rằng hàng tấn hình ảnh khác nhau đang tồn tại trên Internet!

@ user11656 bạn cho rằng Google Image Search hoạt động giống như tìm kiếm trong một ứng dụng tiêu chuẩn bạn có thể sử dụng. Mọi thứ thường hoạt động rất khác nhau ở quy mô đó. Có khả năng không có một câu trả lời nào cho "tất cả các hình ảnh phù hợp với hoa" vì một máy chủ ở Úc có thể có một hình ảnh được tải lên gần đây chưa được lan truyền đến máy chủ ở Hoa Kỳ. Sau đó, bạn phải đối phó với những thứ như cách trình bày các bản sao và cách thực hiện tất cả những điều đó trên hàng triệu hình ảnh cho hàng triệu người dùng ngay lập tức. Công cụ cứng của nó và bạn phải làm cho thỏa hiệp kiến ​​trúc.
George Mauer


2

Không có câu trả lời nào ở trên là đúng.

Ước tính của Google phải gần với số lượng kết quả thực hơn so với kết quả được đưa ra.

Điều này có thể được hiển thị bằng một ví dụ đơn giản. Chọn một từ thường xuyên như "Nga" hoặc "michael". Trong thực tế, phải có hàng ngàn, nếu không phải hàng trăm ngàn trang web trên internet có chứa những từ đó ở đâu đó trên trang web của họ. Nhưng kết quả của Google chỉ có thể cung cấp cho bạn, giả sử, 700.

Sự thật không phải là Google đưa ra những đánh giá quá cao, mà giờ đây Google hạn chế rất nhiều số lượng kết quả mà nó sẽ mang lại cho bạn. Nó xóa bỏ kết quả nghiêm trọng, gây bất lợi lớn cho cá nhân chúng tôi. Thật không may vì tôi muốn đọc hàng ngàn trang web với các điều khoản của tôi trong một số trường hợp.

Tôi biết điều này bởi vì tôi đã sử dụng Google trong một thời gian dài, có lẽ từ 10 - 15 năm và nhận thấy rằng theo nguyên tắc chung, kết quả cho các thuật ngữ đã ngắn hơn, không dài hơn, mặc dù số lượng trang web có cùng thuật ngữ thường phải đã tăng lên trong thời gian tôi đang sử dụng Google.

Trong khi trước đây, nhiều năm trước tôi có thể nhận được 1000 kết quả cho một số điều khoản, thì bây giờ tôi nhận được 500 kết quả cho cùng một điều khoản mà tôi sẽ nhận được 1000 kết quả.


2
Xin lưu ý rằng "ở trên" không có ngữ cảnh trong câu trả lời, vì chúng có thể được sắp xếp theo nhiều cách khác nhau. Ngay cả khi bạn giả sử sắp xếp mặc định theo "phiếu", vị trí của họ sẽ thay đổi khi số phiếu tăng và giảm được thêm vào.
ale

Rất thú vị! Nga cho tôi ngay bây giờ chỉ có 322 kết quả và nó chỉ hiển thị như vậy trên trang thứ 34 cuối cùng . Cho đến lúc đó nó sẽ cho kết quả 799 000 000! Mặc dù đây là một cái nhìn sâu sắc tốt đẹp nhưng nó vẫn không có vẻ đúng. Tôi không nghĩ các ước tính đầu tiên là chính xác và ý định chỉ mang lại kết quả được hiển thị, chứ không phải "có bao nhiêu suy nghĩ tồn tại trên web", do đó, trang cuối cùng đã sửa nó.
cregox

1

Các vấn đề với công cụ tìm kiếm Google (Hình ảnh) là nó nhằm mục đích liên quan bằng cách loại bỏ phương sai. Đầu tiên, điều quan trọng là phải hiểu cách thức hoạt động của nó. Một hình ảnh được tải lên internet cần phải được lập chỉ mục theo hai cách:

  • dựa trên tính nguyên bản (hình ảnh sẽ được phân tích bởi một "bot thông minh" dựa trên màu sắc, kích thước, hoa văn, nhận dạng hình dạng, loại, v.v.)
  • dựa trên sự giống nhau (hình ảnh được phân tích bởi "bot2 thông minh" và được tham chiếu chéo với các hình ảnh đã có trong cơ sở dữ liệu và được gắn thêm một hoặc hai nhãn danh mục: "hình ảnh phù hợp" và "hình ảnh tương tự như ... ")

Sau khi lập chỉ mục được thực hiện, hình ảnh sẽ kế thừa "từ khóa" là kết quả của sự công nhận để tránh hiển thị kết quả ngoài chủ đề cho người xác nhận. Vấn đề là mỗi từ khóa là một cụm từ độc lập với giá trị được gán theo% dựa trên mức độ liên quan (đó là lý do nhóm nhiều từ trong hộp tìm kiếm dẫn đến kết quả ít hơn và cả khi bạn tìm kiếm hình ảnh bằng cách tải lên hoặc nhập URL, Google sẽ chỉ định "đoán" chỉ với các từ khóa hàng đầu, điều đó có nghĩa là tìm kiếm sẽ không bao giờ hiển thị cho bạn tất cả các hình ảnh đơn giản vì tìm kiếm không được thiết kế để làm như vậy)

Vì vậy, vào cuối một ngày khi bạn thực hiện tìm kiếm hình ảnh và ngay dưới hộp tìm kiếm, bạn sẽ thấy một con số khổng lồ nói rằng "25.270.000.000 kết quả (0,55 giây)" hầu như luôn là một số giả, bởi vì bạn sẽ không nhận được nữa hơn 200 (tối đa 500 nhưng chỉ sau khi người dùng yêu cầu) kết quả cũng được lọc để loại trừ:

  • trùng lặp bên ngoài (nếu cùng một hình ảnh là hơn 2 lần trên cùng một trang web)
  • trùng lặp liên quan (chỉ hiển thị "kết quả tốt nhất" - xem hình ảnh bên dưới)
  • hình ảnh có vấn đề với pháp luật (xem hình ảnh bên dưới)
  • hình ảnh vi phạm DMCA (xem hình ảnh bên dưới)
  • hình ảnh có nguồn gốc từ các nguồn SPAM, MALware, PHISHING
  • hình ảnh bị ẩn (nếu người dùng không tắt Tìm kiếm an toàn)
  • hình ảnh được Google đưa vào danh sách đen ( bài viết )
  • hình ảnh có AR khác nhau (về cơ bản tất cả hình ảnh có tỷ lệ khung hình khác với tham chiếu tìm kiếm hình ảnh, ví dụ: bạn có thể bỏ lỡ tất cả kết quả mong muốn nếu bạn tìm kiếm theo hình ảnh đã chọn - giả sử với tỷ lệ lạ 9: 7 - trong khi tất cả hình ảnh được lập chỉ mục trong Google có tỷ lệ 3: 4 - có thể là nhược điểm lớn nhất của công cụ tìm kiếm này vì nó luôn tuân theo Tỷ lệ khung hình là tiêu chí đầu tiên)
  • và một loạt các

Để tóm tắt nó: kết quả tìm kiếm của một hình ảnh không bao giờ có liên quan đầy đủ. Đôi khi bạn sẽ nhận được kết quả mong muốn cuối cùng của mình với cụm từ tìm kiếm "poster poster" nếu không đó có thể là "cover gate", "gate Bluray", "gate dvd", "gate 2015" hoặc thậm chí "自衛隊 彼 の 地 に て 斯 く 戦え り "- bạn không thể có kết quả hình ảnh" TẤT CẢ ", bởi vì không có bất cứ thứ gì là" TẤT CẢ ", đó là lý do tại sao cần phải chơi với nó để đạt được điều đó. Và cũng có liên quan để đề cập, rằng có những công cụ tìm kiếm hình ảnh khác có thể thực hiện công việc theo cách khác hơn, bởi vì chúng hoạt động trên các tiêu chuẩn và tiêu chí khác nhau. Nó không phải và không bao giờ là "Google" - chỉ ... >> https://www.yandex.com/images/

tiện ích mở rộng đáng chú ý:


Một lần nữa, đánh dấu những điều này là trùng lặp sẽ hữu ích hơn nhiều so với việc đăng câu trả lời cho mỗi câu hỏi.
jonsca

0

Ở đầu trang, nó cho biết trang 70 trên 7000 kết quả (ví dụ). Nó sẽ cho số trang và bao nhiêu kết quả. Không có 70 kết quả, nhưng 70 trang. Hi vọng điêu nay co ich.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.