Làm cách nào để tìm thấy khi một URL được Google lập chỉ mục đầu tiên?


16

Làm cách nào để biết khi nào một URL cụ thể được Google lập chỉ mục đầu tiên? Tôi thích một giải pháp hoạt động ngay cả đối với các URL của đối thủ cạnh tranh không thuộc sở hữu của tôi.


1
Câu trả lời là "không". Google thậm chí có thể không lưu trữ thông tin này (vì không có lý do cụ thể tại sao họ phải), hoặc, ngay cả khi họ làm như vậy, họ có thể không tiết lộ cho bên thứ ba.
Ilmari Karonen

1
Giống như những người khác đã đề cập, bạn không thể có được thông tin này. Nếu bạn có quyền truy cập vào nhật ký máy chủ, bạn có thể thấy khi nó được thu thập thông tin lần đầu tiên, nhưng ngay cả điều đó không có nghĩa là nó đã được lập chỉ mục sau đó.
John Mueller

Câu trả lời:


15

Để biết tuổi của URL, bạn có thể theo liên kết này bằng cách thay thế www.example.combằng URL bạn muốn:

https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl

Ví dụ, đây là kết quả từ Google cho các trang web Meta của Stack Overflow : nhập mô tả hình ảnh ở đây

Mặt khác, máy Wayback cũng là một giải pháp tốt nhưng ít chính xác hơn từ kinh nghiệm của tôi.


3
Tính năng đó của Google có sẵn bằng tiếng Anh không? Bạn đã liên kết với phiên bản tiếng Pháp.
Stephen Ostermiller

1
@StephenOstermiller Chỉ cần thay đổi tld từ .frsang .com.
MDMoore313

2
@Zistoloen +1 cho câu trả lời của bạn nhưng tôi nghi ngờ trong truy vấn của bạn. Như bạn đã nói, tôi đã tìm kiếm www.stackexchange.com bằng truy vấn mẫu của bạn nhưng nó không hiển thị bất kỳ kết quả nào. Tôi đã tìm kiếm bằng cách xóa wwwcũng tại thời điểm này, nó hiển thị kết quả cho ngày Dec 1, 2014mà là ngày gần đây không thể là tuổi của URL. Tôi đang tìm kiếm không chính xác? hay thiếu thứ gì?
Sathiya Kumar

2
Tôi đã "đánh cắp" câu trả lời này và thêm nó vào câu trả lời của tôi với một lời giải thích tốt hơn. Đây là một mẹo hay, Zistoloen.
Stephen Ostermiller

6
@Stephen & Zistoloen: Đó thường không phải là ngày mà trang đầu tiên được Google lập chỉ mục. Dựa trên một số thử nghiệm, ngày được hiển thị qua phương pháp này dường như được lấy từ nội dung của trang (nếu Google nghĩ rằng nó nhìn thấy một cái gì đó trông giống như ngày "được xuất bản" hoặc "sửa đổi lần cuối vào") hoặc, nếu không như vậy ngày được tìm thấy trong nội dung, dựa trên ngày cuối cùng Google quan sát thấy sự thay đổi (đáng kể?) đối với trang. Tất nhiên, nếu trang không bao giờ thay đổi sau lần xuất bản đầu tiên, thì điều này có thể giống với ngày xuất bản của nó, nhưng không có gì đảm bảo điều đó.
Ilmari Karonen

8

Zistoloen đã tìm ra cách để Google hiển thị ngày khi lần đầu tiên lập chỉ mục nội dung của trang. Tôi cũng đang thêm nó vào câu trả lời của mình vì tôi nghĩ tôi có thể giải thích rõ ràng hơn.

  1. Kết quả là tìm kiếm một cái gì đó mang đến trang bạn muốn
  2. Sử dụng "Công cụ tìm kiếm"
  3. Chọn "Phạm vi tùy chỉnh ..." từ danh sách "Bất kỳ lúc nào"
  4. Đặt trong phạm vi ngày lớn như 1/1/1900 đến 1/1/2020

Google sau đó sẽ hiển thị ngày mà nó phát hiện ra nội dung trên trang trong kết quả tìm kiếm.

lập chỉ mục đầu tiên

Nếu trang được cập nhật với nội dung mới, Google cũng cập nhật ngày này. Vì vậy, đây là ngày "được lập chỉ mục nội dung đầu tiên" này hơn là ngày "được lập chỉ mục đầu tiên cho URL này".


Bộ đệm Google cho một trang hiển thị khi trang được lập chỉ mục lần cuối. Bạn có thể thấy rằng trang chủ Stack Exchange đã được lập chỉ mục lần cuối ngày hôm nay:

nhập mô tả hình ảnh ở đây


Một tùy chọn khác là sử dụng máy Wayback của Internet Archive . Điều đó cho bạn thấy một trang trông như thế nào trong quá khứ. Bạn có thể tìm ra khi các trang được xuất bản lần đầu tiên. Cả Google và Internet Archive thu thập dữ liệu và sử dụng trang ngay sau khi nó được xuất bản lần đầu tiên.


1
Tùy chọn đầu tiên của bạn sẽ cho kết quả chính xác cho tất cả các URL? Tôi đã tìm kiếm bing.com như bạn đã giải thích nhưng không nhận được ngày lập chỉ mục đầu tiên bing.com. Xin lỗi nếu tôi sai?
Sathiya Kumar

1
Nó có vẻ chính xác miễn là nội dung trên trang không thay đổi. Google có thể đặt lại ngày này nếu trang được đại tu. Trang chủ của tôi được liệt kê là ngày 1 tháng 2 năm 2002 mặc dù một trang nội bộ được liệt kê là ngày 1 tháng 2 năm 2001. Trang chủ được thiết kế lại vào khoảng thời gian đó trong khi trang nội bộ đã không thay đổi đáng kể từ năm 2001.
Stephen Ostermiller

@SathiyaKumar Bing.com cung cấp cho tôi ngày 19 tháng 3 năm 2014 cho tôi bằng phương pháp này. Xin lưu ý rằng mọi thứ không được google lập chỉ mục (thông qua robot.txt hoặc cách khác) rõ ràng sẽ không được hiển thị thông qua cách này.
Thebluefish

4

Có thể không cách nào để tìm hiểu khi một trang web tùy ý được Google lập chỉ mục lần đầu tiên - chắc chắn tôi không biết cách nào để làm như vậy. Có thể Google chỉ đơn giản là không lưu trữ thông tin đó, vì không có lý do thực sự tại sao họ cần. Bên cạnh đó, ngay cả khi họ lưu trữ thông tin này, họ thực sự không có lý do đặc biệt nào để cung cấp miễn phí cho bên thứ ba.

(Nếu đó là trang của riêng bạn và bạn có quyền truy cập vào nhật ký truy cập máy chủ web cũ của mình, thật dễ dàng - chỉ cần tìm kiếm nhật ký cho lần truy cập đầu tiên từ Googlebot đến trang đó. Nhưng nếu không thì không có cách nào để biết chắc chắn.)


Trong mọi trường hợp, phương pháp được mô tả bởi Zistoloen và Stephen Ostermiller trong câu trả lời của họ thường không tiết lộ ngày mà một URL cụ thể được Google lập chỉ mục lần đầu tiên. Thay vào đó, nó hiển thị ngày mà Google nghĩ rằng nội dung tại URL đã được xuất bản hoặc cập nhật lần cuối và thường dựa trên những nỗ lực đáng tin cậy hơn hoặc ít hơn của Google để "đánh hơi" ngày từ chính nội dung trang.

Trong video này , Matt Cutts của Google chạm nhanh vào cách chọn những ngày này. Để thuận tiện, tôi đã sao chép đoạn video có liên quan (khoảng từ 2:09 đến 2:22) bên dưới:

"... thường bạn sẽ thấy ngày, khi chúng tôi suy luận hoặc khi chúng tôi lần đầu tiên nhìn thấy nó, bất cứ khi nào chúng tôi thu thập dữ liệu trang đó hoặc nếu chúng tôi có thể tìm thấy nó ở đâu đó trên trang và chúng tôi có thể trích xuất ngày đó, bạn ' sẽ thấy điều đó ngay khi bắt đầu đoạn trích. "

Đối với các trang như bài đăng trên blog, trang wiki hoặc câu hỏi Stack Exchange, trong đó trang chạy phần mềm tự động báo cáo ngày tạo / sửa đổi chính xác trên trang đó, ngày được báo cáo bởi Google có thể khớp với ngày đó. Tuy nhiên, đối với các loại trang khác, trình thám thính ngày của Google phải làm việc chăm chỉ hơn và không phải lúc nào nó cũng đúng (bất cứ điều gì "đúng" có thể có nghĩa, trong ngữ cảnh này).

Cụ thể, những ngày này về cơ bản là vô dụng để xác định cách đây một trang được lập chỉ mục bao lâu , vì hai lý do:

  • Nếu một trang đã được sửa đổi gần đây và ngày sửa đổi được hiển thị nổi bật trên trang, Google có thể chọn nó là "ngày" của trang, ngay cả khi sửa đổi là hoàn toàn không đáng kể.

    Ví dụ: trang wiki khá cũ này (được archive.org lập chỉ mục lần đầu tiên vào năm 2003 ) hiện đang được Google đánh giá là từ ngày 10 tháng 11 năm 2014 - ngày mà nó được chỉnh sửa gần đây nhất, như được hiển thị ở cuối trang. Sự thay đổi xảy ra vào ngày đó? Chỉ cần xóa một liên kết duy nhất từ ​​dưới cùng của trang.

  • Ngược lại, Google dường như rất vui khi chấp nhận "ngày xuất bản" rất cũ nếu tìm thấy chúng trên trang - ngay cả những ngày trước khi ra mắt World Wide Web .

    Ví dụ: trang này trong một cuộc thi lập trình cũ được Google đề ngày 15 tháng 9 năm 1986 - thực ra là ngày diễn ra sự kiện được mô tả trên trang. Tương tự, trang này ghi lại cuộc đình công của sinh viên năm 1970 được Google ghi ngày 10 tháng 5 năm 1970 (ngày của một trong những tài liệu được quét trên trang), và, thậm chí còn vô lý hơn, trang hướng dẫn Linux này được Google đề ngày đến ngày 4 tháng 11 , 1989 (một ngày ví dụ ngẫu nhiên được sử dụng trên trang).

    Bạn có thể tìm thấy nhiều ví dụ như vậy bằng cách sử dụng tìm kiếm phạm vi ngày tùy chỉnh được mô tả bởi Stephen và Zistoloen, nhưng đặt đầu trên của phạm vi thành, giả sử, ngày 6 tháng 8 năm 1991 .


Trong câu trả lời của bạn, bạn chủ yếu phản đối câu trả lời của Stephen và Zistoloen nhưng tôi không tìm thấy câu trả lời thích hợp nào cho câu hỏi của OP "Làm thế nào để tôi tìm thấy khi một URL được Google lập chỉ mục đầu tiên?" trong câu trả lời của bạn !!
Sathiya Kumar

Có thể không câu trả lời nào khác, "bạn không thể" hoặc "không ai biết làm thế nào". Nhưng bạn đã đúng, hãy để tôi chỉnh sửa nó thành câu trả lời của tôi.
Ilmari Karonen

@llmariKaronen +1 để chỉnh sửa và thêm câu trả lời cho câu hỏi thực tế của OP.
Sathiya Kumar
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.