Tại sao công cụ tìm kiếm không lập chỉ mục nội dung của tôi?


29

Đây là một vị tướng, cộng đồng wiki nhận tất cả câu hỏi và câu trả lời cặp nhằm giải quyết bất kỳ câu hỏi liên quan đến lý do một trang web hoặc trang web cụ thể nội dung không xuất hiện trong kết quả công cụ tìm kiếm.

Nếu câu hỏi của bạn bị đóng như là một bản sao của câu hỏi này và bạn cảm thấy rằng thông tin được cung cấp ở đây không cung cấp câu trả lời đầy đủ, vui lòng mở một cuộc thảo luận về Pro Webmasters Meta .

Trang web của tôi (hoặc các trang cụ thể trên trang web của tôi) không xuất hiện trong kết quả của công cụ tìm kiếm.

Tại sao nội dung của tôi không được lập chỉ mục và tôi có thể làm gì về nội dung đó?

Câu trả lời:


36

Có một số lý do khiến nội dung của bạn có thể không xuất hiện trong kết quả của công cụ tìm kiếm, tuy nhiên, điều quan trọng cần lưu ý là chỉ mục của công cụ tìm kiếm có thể chứa các trang mà nó không hiển thị trong trang kết quả .

Làm thế nào để biết nếu nội dung của bạn thực sự được lập chỉ mục

Thật sự có thể khó để biết nếu nội dung của bạn được lập chỉ mục.

  • Tìm kiếm tất cả các tài liệu từ trang web của bạn và xem có bao nhiêu tài liệu được liệt kê
    • Google: enter site:example.com( example.comtên miền của bạn ở đâu , không được có bất kỳ khoảng trống nào sau dấu hai chấm.)
    • Bing: nhậpsite: example.com
    • Yahoo: nhập site: example.com(hoặc sử dụng mẫu tìm kiếm nâng cao)
  • Tìm kiếm một tài liệu cụ thể bằng một câu duy nhất gồm tám đến mười hai từ và tìm kiếm câu đó trong dấu ngoặc kép. Ví dụ: để tìm tài liệu này, bạn có thể chọn tìm kiếm "số lý do nội dung của bạn có thể không xuất hiện trong kết quả của công cụ tìm kiếm"
  • Ngoài ra, hãy tìm kiếm các từ khóa bằng cách sử dụng inurl:intitle:bạn có thể thử một cái gì đó như thế, keyword with another keyword inurl:example.comđiều này sẽ mang đến các trang upi chỉ được lập chỉ mục cho tên miền được chỉ định.

    • Đăng nhập vào công cụ quản trị trang web để xem số liệu thống kê từ chính công cụ tìm kiếm về số lượng trang được lập chỉ mục từ trang web
    • Công cụ quản trị trang web của Google - Thông tin có sẵn trong phần "Sức khỏe" »" Trạng thái chỉ mục ". Nếu bạn đã gửi bản đồ trang web, bạn cũng có thể xem có bao nhiêu tài liệu trong mỗi tệp bản đồ trang web đã được lập chỉ mục.
    • Công cụ quản trị trang web Bing

Trong một số trường hợp, các tài liệu có thể không được lập chỉ mục thông qua một trong các phương pháp này, nhưng các tài liệu có thể được tìm thấy trong chỉ mục bằng các phương pháp khác. Ví dụ: các công cụ quản trị trang web có thể báo cáo rằng một vài tài liệu được lập chỉ mục ngay cả khi bạn có thể tìm kiếm câu của chúng và tìm tài liệu trên công cụ tìm kiếm. Trong trường hợp này, các tài liệu được thực sự lập chỉ mục.

Làm thế nào nội dung trở thành chỉ mục

Trước khi công cụ tìm kiếm lập chỉ mục nội dung, họ phải tìm thấy nó bằng trình thu thập dữ liệu web. Bạn nên kiểm tra nhật ký máy chủ web của mình để xem liệu trình thu thập thông tin của công cụ tìm kiếm (được xác định bởi tác nhân người dùng của họ - ví dụ: Googlebot , Bing / MSNbot ) có đang truy cập trang web của bạn không.

Các công cụ tìm kiếm lớn hơn như Google và Bing thường thu thập dữ liệu các trang web thường xuyên, nhưng trình thu thập thông tin có thể không biết về trang web mới. Bạn có thể thông báo cho các công cụ tìm kiếm về sự tồn tại của trang web của mình bằng cách đăng ký làm quản trị trang web của nó ( Công cụ quản trị trang web của Google , Công cụ quản trị trang web Bing ) hoặc, nếu công cụ tìm kiếm không cung cấp cơ sở này, hãy gửi liên kết đến trình thu thập thông tin của nó (ví dụ: Yahoo ).

Trang web / nội dung của bạn đã trực tuyến được bao lâu rồi?

Các công cụ tìm kiếm có thể lập chỉ mục nội dung rất nhanh sau khi nó được tìm thấy, tuy nhiên, những cập nhật này đôi khi bị trì hoãn. Các công cụ tìm kiếm nhỏ hơn cũng có thể ít phản hồi hơn và mất nhiều tuần để lập chỉ mục nội dung mới.

Nếu nội dung của bạn chỉ trực tuyến trong vài ngày và không có bất kỳ liên kết nào từ các trang web khác (hoặc các liên kết của nó đến từ các trang web mà trình thu thập thông tin không truy cập thường xuyên) thì có lẽ nó không được lập chỉ mục. Nếu trang web của bạn không hoạt động được hơn một vài tháng, các công cụ tìm kiếm có thể không đủ tin tưởng để lập chỉ mục nhiều nội dung từ đó.

Nội dung đã bị loại trừ bởi quản trị trang web?

Bước này đặc biệt quan trọng nếu bạn đang tiếp quản một trang web từ người khác và có vấn đề với một trang hoặc thư mục cụ thể: kiểm tra loại trừ robot.txtMETA và loại bỏ chúng nếu bạn muốn trình thu thập thông tin lập chỉ mục nội dung bị loại trừ.

Có một vấn đề kỹ thuật ngăn nội dung của bạn được lập chỉ mục?

Nếu bạn có một trang web được thiết lập nhưng nội dung cụ thể không được lập chỉ mục (không có lần truy cập trình thu thập dữ liệu web nào trên các URL có nội dung cư trú), các công cụ quản trị trang web do Google và Bing cung cấp có thể cung cấp thông tin chẩn đoán hữu ích.

Tài liệu về Lỗi thu thập dữ liệu của Google cung cấp nền tảng rộng rãi về các sự cố phổ biến cho trình thu thập dữ liệu web ngăn nội dung bị lập chỉ mục và nếu bạn sử dụng Công cụ quản trị trang web của Google, bạn sẽ nhận được cảnh báo nếu phát hiện bất kỳ sự cố nào trên trang web của bạn.

Sửa lỗi và cấu hình sai càng nhanh càng tốt để đảm bảo rằng tất cả nội dung trang web của bạn được lập chỉ mục.

Là nội dung chất lượng thấp?

Công cụ tìm kiếm không lập chỉ mục hầu hết các trang họ thu thập dữ liệu. Họ chỉ lập chỉ mục nội dung chất lượng cao nhất. Công cụ tìm kiếm sẽ không lập chỉ mục nội dung nếu:

  • Đó là thư rác, vô nghĩa, hoặc vô nghĩa.
  • Nó được tìm thấy ở nơi khác. Khi các công cụ tìm kiếm tìm thấy nội dung trùng lặp, họ chỉ chọn một trong các mục trùng lặp để lập chỉ mục. Thông thường đó là bản gốc có nhiều danh tiếng và liên kết.
  • Nó mỏng Nó cần nhiều hơn một vài dòng văn bản gốc. Tốt hơn là nhiều hơn nữa. Các trang được tạo tự động với ít nội dung, chẳng hạn như một trang cho mỗi người dùng của bạn không có khả năng được lập chỉ mục.
  • Nó không có đủ danh tiếng hoặc liên kết. Một trang có thể được chôn quá sâu trong trang web của bạn để xếp hạng. Bất kỳ trang nào không có liên kết bên ngoài và nhiều hơn một vài lần nhấp từ trang chủ sẽ không thể được lập chỉ mục.

Là một số nội dung của bạn được lập chỉ mục, nhưng không phải tất cả?

Nếu trang web của bạn có hàng trăm trang, Google sẽ gần như không bao giờ chọn lập chỉ mục cho mỗi trang. Nếu trang web của bạn có hàng chục nghìn trang, việc Google chọn chỉ mục một phần nhỏ trong số các trang đó là điều rất phổ biến.

Google chọn số lượng trang để lập chỉ mục từ một trang web dựa trên danh tiếng chung của trang web và chất lượng nội dung. Google thường lập chỉ mục phần trăm lớn hơn của một trang web theo thời gian khi danh tiếng của trang web tăng lên.



1

Tôi nghĩ rằng tôi không cần phải lặp lại điều tương tự như đã nêu ở trên, tuy nhiên nếu bạn không quen với công cụ mới thì đây là cách để kiểm tra nó bên dưới.

Bạn có thể kiểm tra xem tệp robot.txt của bạn có chặn nội dung hay không bằng cách truy cập Công cụ kiểm tra robot.txt của Google Webmaster cũ

nhập mô tả hình ảnh ở đây

Google Search Console (phiên bản mới)

Bảng điều khiển tìm kiếm của Google cung cấp thông tin có giá trị hơn phiên bản cũ. Kiểm tra các vấn đề ngay từ Google Search Console, xem trang của bạn có được thu thập thông tin hay không, được lập chỉ mục hay không, trực tiếp hay không và các vấn đề nếu có.

  1. Đăng nhập vào Google Search Console của trang web của bạn
  2. Nếu bạn có nhiều thuộc tính miền thì hãy chắc chắn rằng bạn đã chọn thuộc tính mong muốn.

Công cụ không dùng nữa trong Google Webmaster

Điều này đã lỗi thời

Đây là cách bạn có thể đi qua Search Console mới

Bảng điều khiển tìm kiếm mới của Google


0

Nếu bạn có tệp robot.txt trong thư mục gốc, có thể yêu cầu Google không lập chỉ mục trang web của bạn.

Bạn đã kiểm tra cho điều đó?

Thông thường sẽ an toàn khi chỉ xóa (hoặc đổi tên) các tệp đó vì có vẻ như bạn KHÔNG muốn được lập chỉ mục.

QUAN TRỌNG: Đây có thể là một công cụ thỏa thuận nếu bạn đang cố gắng để Google Adsense hoạt động trên trang web của mình.

Bất kể bạn đặt mã đặc biệt ở đâu, nếu bạn không được lập chỉ mục, bạn sẽ được thông báo trang web của bạn không hoạt động để họ không thể xác minh mã.


Tệp robot.txt có bộ quy tắc do người dùng xác định để thu thập dữ liệu hay không, vì vậy loại bỏ nó không phải là một giải pháp vì đây là tệp đầu tiên được thu thập thông tin. Giải pháp tốt nhất là sửa các quy tắc, kiểm tra tệp robot.txt thêm chỉ thị sơ đồ trang web trong robot.txt của bạn để giữ cho sơ đồ trang web của bạn được cập nhật với các thuộc tính tần số và thay đổi tần số.
Deepak Mathur
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.