Tôi đã nghiên cứu câu trả lời cho câu hỏi này theo cách này: sử dụng Google vì đây là ví dụ tôi có, cách Google lấy ngày tạo và ngày sửa đổi và định dạng ngày mà Google nhận ra. Xin hiểu rằng thông tin này không tồn tại trên một vài trang và tôi đã phải tìm ra dữ liệu từ rất nhiều nguồn mà một số trong đó dường như không áp dụng trực tiếp và ghép chúng lại với nhau. Trong một số trường hợp, thông tin có nguồn gốc từ một số nguồn và không phải lúc nào cũng có thể trích dẫn.
Google tìm ngày trang theo thứ tự này; URL, thẻ tiêu đề, nội dung (nội dung), thẻ meta, tiêu đề phản hồi HTTP ít nhất là liên quan đến công cụ tìm kiếm Google. Trong các đoạn khác trong các tài liệu khác, không có thứ tự nào được ghi lại, nhưng danh sách đã được thảo luận và dường như để xác nhận danh sách. Nếu bạn nghĩ về nó, điều này phản ánh thứ tự mà một công cụ tìm kiếm sẽ làm; một - khám phá trang của bạn (liên kết) và hai - đọc trang của bạn từ trên xuống dưới (tiêu đề, nội dung và thẻ meta) ngoại trừ thẻ meta (chi tiết nhỏ) và tiêu đề phản hồi HTTP. Dưới đây là danh sách liên quan đến thiết bị:https://developers.google.com/search-appliance/documentation/68/admin_crawl/Preparing#docdaterule
Lưu ý: Ngày bắt đầu là ngày mà trang được Google yêu cầu lần đầu tiên. Trong trường hợp không có ngày tạo, ngày bắt đầu được sử dụng.
1] Bất kỳ công cụ tìm kiếm nào cũng có thể yêu cầu tài nguyên thông qua yêu cầu HTTP GET và máy chủ web trả về ngày sửa đổi cuối cùng trong tiêu đề phản hồi với tài nguyên trong gói dữ liệu.
2] Bất kỳ công cụ tìm kiếm nào cũng có thể yêu cầu thông tin tiêu đề của tài nguyên thông qua yêu cầu HTTP Head và máy chủ web trả về ngày đã sửa đổi trong tiêu đề phản hồi mà không cần tài nguyên trong gói dữ liệu.
3] Bất kỳ công cụ tìm kiếm nào cũng có thể yêu cầu nếu một tài nguyên đã được sửa đổi kể từ một ngày nhất định bằng cách yêu cầu tài nguyên có HTTP GET với if-Sửa đổi-kể từ khi được đặt thành một ngày. Nếu tài nguyên đã được sửa đổi kể từ ngày được đặt, máy chủ web sẽ phản hồi với phản hồi 200 Ok và trả về tài nguyên hoặc nếu tài nguyên chưa được sửa đổi kể từ ngày được đặt, máy chủ web sẽ phản hồi với 304 Không được sửa đổi mà không trả lại tài nguyên .
Google thực hiện nhiều yêu cầu bằng phương pháp số 3 để tiết kiệm băng thông. Bạn sẽ thấy những điều này trong các tệp nhật ký máy chủ web của bạn.
Lưu ý: Có thể hệ thống quản lý nội dung (CMS) hoặc phần mềm khác không thể cung cấp ngày thích hợp trong tiêu đề phản hồi.
Những ví dụ ngày này cũng đến từ tài liệu thiết bị của Google nhưng cũng tồn tại ở những nơi khác liên quan đến tìm kiếm chung. Tôi lấy các chi tiết này từ tài liệu thiết bị đơn giản vì nó có thể được cắt và dán dưới dạng một danh sách mà ở những nơi khác nó không gọn gàng.
4] Google tìm kiếm một ngày trong URL. Nó tìm các định dạng sau; YYYMMDĐHH - YYYY - YYYYMM.
5] Google tìm kiếm một ngày trong thẻ tiêu đề. Nó tìm các định dạng sau; YYYMMDDHH - YYYY - YYYYMM mặc dù tôi nghi ngờ các định dạng khác có thể được nhận ra. Xem bên dưới.
6] Google tìm kiếm một ngày trong thẻ body (nội dung). Nó tìm các định dạng sau; YYYMMDĐHH - YYYYMMD Xem bên dưới.
Lưu ý: Được biết, Google trông đặc biệt cho một ngày ngay dưới H1
thẻ đầu tiên . Điều này là do các blog thường đặt ngày ở vị trí này.
7] Google tìm kiếm một thẻ meta như thế này. <meta http-equiv="last-modified" content="YYYY-MM-DD@hh:mm:ss TMZ" />
Google cũng được cho là nhận ra các định dạng ngày sau.
YYYY-MD - YYYY.MD - YYYY / M / D - MD-YYYY - MDYYYY - M / D / YYYY - YY-MM-DD - YY.MM.DD - YY / MM / DD - WK, D MON, Y - WK, MON D, YR - D MON, YR - MON YYYY - MON D, YR - MON YY - YYYY-DM - YYYY.DM - YYYY / D / M - DM-YYYY - DMYYYY - D / M / YYYY DD-MM-YY - MM-DD-YY - DD / MM / YY - MM / DD / YY - YYYYMMDDHH - YYYYMMDD - YYYYMM - YYYY - DDMMYYYY - MMDDYYYY - YYMMYYYYY
Các nghiên cứu tôi tìm thấy đã không trả lời câu hỏi về thời gian.
Trong trường hợp các ví dụ được trích dẫn, các trang không cung cấp manh mối ngày ngoại trừ trong thẻ span có thể bị bỏ qua. Có thể phần mềm / máy chủ web SE không thể trả về ngày tạo và sửa đổi trong bất kỳ tiêu đề phản hồi nào.
Tại sao và làm thế nào Google bắt nguồn những ngày này là một câu hỏi hay có thể không bao giờ được giải quyết. Tôi sẽ tiếp tục tìm kiếm tuy nhiên.