Điều gì có thể gây ra Khám phá - hiện không được lập chỉ mục trong chương trình GWT mới


18

GWT mới hiển thị các liên kết sơ đồ trang web được chia thành các danh mục mới. Hai điều làm tôi bối rối: 1. Đã phát hiện- hiện không được lập chỉ mục 2. Đã thu thập thông tin - hiện không được lập chỉ mục

Các lý do có thể cho việc này là gì, và có bất kỳ ý nghĩa rộng của trang web? Đây có phải là một dấu hiệu từ Google Tôi nên xem xét loại bỏ những thứ này?

nhập mô tả hình ảnh ở đây

Câu trả lời:


11

Nó chỉ là một phần của quá trình. Không có gì để bạn làm cho đến khi bạn thực sự gặp lỗi .

Để hiểu các danh mục, bạn cần hiểu cách lập chỉ mục hoạt động, đó là điều được thực hiện khá nhiều liên tục:

  • Googlebot tìm nạp một trang có nghĩa là tải nội dung của nó lên các máy chủ của Google. Khi điều này xảy ra, trang được thu thập thông tin .
  • Nó sau đó đặt nội dung của trang đã tải xuống vào chỉ mục. Điều này có nghĩa là trang được lập chỉ mục .
  • Trong khi thu thập dữ liệu trang, nó tìm thấy và đặt chúng trong hàng đợi. Những liên kết được phát hiện .

Vì thế:

  • Phát hiện không được lập chỉ mục có nghĩa là liên kết đã được thêm vào hàng đợi những thứ mà Googlebot cuối cùng có thể thu thập dữ liệu. Vì web hầu như vô hạn và có sự ưu tiên, nên nó có thể không bao giờ thực sự đến đó.
  • Thu thập thông tin hiện không được lập chỉ mục có nghĩa là trang đã được tải xuống máy chủ Google nhưng nội dung của nó chưa được chèn vào chỉ mục.

1
Tôi muốn thêm rằng Google quyết định thu thập thông tin dựa trên PageRank. Liên kết đến trang thường xuyên hơn hoặc nổi bật hơn (thậm chí là nội bộ) có thể khiến Googlebot thu thập dữ liệu.
Stephen Ostermiller

3
Tôi nghĩ rằng "hiện không được lập chỉ mục" cũng có thể có nghĩa là Google đang chọn không lập chỉ mục cho nó. Nó có thể được nhân đôi hoặc nhìn chất lượng thấp. Nó có thể không có đủ Pagerank. Google có thể nghĩ rằng nó sẽ không phù hợp với đủ các tìm kiếm.
Stephen Ostermiller

Đây là những gì tôi đã gợi ý với ưu tiên . Điều này xảy ra với các liên kết bị nghi ngờ trùng lặp (đôi khi vì chúng chỉ khác nhau về một tham số hoặc khớp với một quy tắc khác).
Itai

Các trang thả vào và ra khỏi "Được thu thập thông tin hiện không được lập chỉ mục" mà không có bất kỳ sự chú ý nào từ tôi. Thông tin cũng đáng ngờ. Ví dụ: một url được kiểm tra dẫn đến một thông báo rằng nó được lập chỉ mục, nhưng không có trong bất kỳ sơ đồ trang web nào ... trang nằm trong sơ đồ trang web và đã được nhiều năm. Bản cập nhật algo gần đây đã gửi báo cáo này và đây.
GLCoder

3

Google có thể khám phá và thu thập dữ liệu các trang của bạn, nhưng điều đó không có nghĩa là nó sẽ nhất thiết phải lập chỉ mục cho chúng.

Có nhiều lý do tại sao Google có thể không lập chỉ mục một trang. Có lẽ nó tìm thấy nội dung trùng lặp. Có lẽ nó không cảm thấy rằng nó cung cấp đủ giá trị cho bất kỳ truy vấn tìm kiếm cụ thể nào. Google có thể đã tìm thấy một cái gì đó về trang của bạn mà nó không thích.

Dù lý do có thể là gì, Google vẫn chưa quyết định lập chỉ mục một số trang mà nó đã phát hiện và thu thập dữ liệu trên trang web của bạn. Điều này khá bình thường đối với một số trang của bạn không được lập chỉ mục. Một số trang trên trang web của tôi không được lập chỉ mục mặc dù nó có nội dung tốt hơn nhiều trang được lập chỉ mục và có số lượng liên kết nội bộ đáng kể. Hệ thống lập chỉ mục của Google là một thuật toán học máy. Và do đó, nó có thể quyết định không lập chỉ mục một số trang đôi khi vì nhiều lý do chưa biết.


1
"Có lẽ nó đã tìm thấy nội dung trùng lặp"> Tôi muốn thêm rằng trong trường hợp này, vì thông báo là "Đã khám phá - hiện không được lập chỉ mục", điều đó cho thấy rằng trang thậm chí chưa được tìm nạp (hoặc nó sẽ được "Thu thập dữ liệu - hiện không được lập chỉ mục "). Vì vậy, tại thời điểm này họ không biết gì về nội dung của nó. Vì vậy, tôi đoán mức độ ưu tiên ở giai đoạn này phụ thuộc vào chính URL, số lượng trang liên kết với nó và những thứ khác.
Niavlys

2

Googlebot có hàng đợi riêng, dựa trên các thông số khác nhau. Đây là thông báo về những URL thậm chí được xếp hàng.

nhập mô tả hình ảnh ở đây

Aj Cohn có một loại ý kiến ​​hài hước về ý nghĩa của thông điệp này:

Được phát hiện - hiện tại không được lập chỉ mục cho thấy họ nhìn thấy nó trong sơ đồ trang web của bạn nhưng dựa trên cách các nội dung khác trông họ thậm chí sẽ không bận tâm đến việc thu thập thông tin. Về cơ bản, thì Ya Ya xấu xí!, Hay, có lẽ nó chỉ là một đại diện cho hiệu quả thu thập thông tin kém.

Thành thật mà nói, tôi không hoàn toàn chắc chắn rằng định nghĩa của Khám phá là chính xác vì nhiều URL mẫu trong trạng thái này có ngày được thu thập lần cuối. Điều đó dường như mâu thuẫn với định nghĩa được cung cấp.


2
Tôi loại bỏ bit "đọc hướng dẫn". Điều đó không hữu ích. Đặc biệt là vì tài liệu của Google khá kém.
Stephen Ostermiller

0

Mặc dù Google đã phát hiện ra URL nhưng nó không cảm thấy nó đủ quan trọng để dành thời gian thu thập dữ liệu. Nếu bạn muốn trang này nhận được lưu lượng tìm kiếm không phải trả tiền, hãy xem xét liên kết đến nó nhiều hơn từ trong trang web của riêng bạn. Hãy chắc chắn để quảng bá nội dung này cho người khác với hy vọng bạn có thể kiếm được liên kết ngược từ các trang web bên ngoài. Liên kết bên ngoài đến nội dung của bạn là một tín hiệu cho Google rằng một trang có giá trị và được coi là đáng tin cậy, điều này làm tăng tỷ lệ cược của nó được lập chỉ mục.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.