Cách xóa URL khỏi Google Search Engine


10

Tôi đã sử dụng rất nhiều thứ như yêu cầu xóa url và xóa các trang, v.v., nhưng vẫn còn các lỗi được hiển thị trong các công cụ quản trị trang web của tôi.

Làm cách nào tôi có thể xóa hoàn toàn các url khỏi Google?

Câu trả lời:



4

Nói chung, bạn không thể. Nhưng có một số lựa chọn.

Một tùy chọn là xóa hoàn toàn các trang khỏi máy chủ của bạn và đảm bảo chúng phản hồi với lỗi 404.

Một cách khác là sử dụng robots.txttệp để ngăn Google thu thập nội dung. Điều này chắc chắn sẽ ngăn các trang mới không được lập chỉ mục, nhưng có thể mất một lúc để các trang hiện tại không còn hiển thị nữa.

Một lựa chọn cuối cùng là sử dụng noindexthẻ meta.

Để biết chi tiết, hãy xem trang của Google về chủ đề này: http://www.google.com/support/webmasters/ thông tin về các thành viên khác nhau


3

Câu trả lời ngắn trong bối cảnh thực tế: bạn không thể .

Những gì bạn có thể làm là xóa các liên kết trỏ đến chúng và đảm bảo rằng các trang phản hồi với mã trạng thái 404 và khi Google thấy rằng các trang không còn tồn tại, cuối cùng chúng sẽ xóa chúng khỏi kết quả.


Đó nên là 410 Gonekhông404 Not Found
Quentin

2

Nếu trang web của bạn có các trang được lập chỉ mục trong Gooogle mà bạn muốn xóa bước đầu tiên là thay đổi trang web của bạn. Bạn có thể xóa các trang, chặn Googlebot xem chúng hoặc bao gồm một thẻ trong đó yêu cầu Google không lập chỉ mục cho chúng.

  • 410 Đã qua - Việc xóa các trang có trạng thái 410 cho phép Googlebot xóa chúng khỏi chỉ mục ngay khi tiếp theo thu thập chúng.
  • 404 Không tìm thấy - Googlebot sẽ xóa URL 404 sau 24 thời gian gia hạn khi lần tiếp theo thu thập chúng.
  • thẻ noindex - Nếu trang vẫn có sẵn trên trang web, nhưng không nên được lập chỉ mục, hãy bao gồm <meta name="robots" content="noindex">trong <head>phần. Google sẽ xóa nó khỏi chỉ mục vào lần tiếp theo nó thu thập thông tin.
  • Bảo vệ mật khẩu - Bảo vệ thông tin bằng cách yêu cầu đăng nhập hoặc mật khẩu để truy cập. Google có thể lập chỉ mục URL trong trường hợp này, nhưng nó sẽ không thể lập chỉ mục nội dung.
  • Không cho phép trong tệp robots.txt - Bạn có thể chặn Googlebot thu thập dữ liệu các trang bằng cách thêm Disallow: /mypagevào tệp robots.txt. Google không thường lập chỉ mục các trang mà nó không thể thu thập dữ liệu và nó không bao giờ lập chỉ mục nội dung của chúng. Tuy nhiên, đôi khi Google có thể hiển thị URL trong kết quả tìm kiếm mà không có đoạn trích nào :

    nhập mô tả hình ảnh ở đây

    Nếu bạn đã xóa trang hoặc thêm noindexthẻ, điều quan trọng là bạn cho phép Googlebot thu thập dữ liệu trang. Nếu bạn cũng không cho phép thu thập dữ liệu trong tệp robots.txt , Googlebot sẽ không thể thấy rằng trang của bạn sẽ bị xóa. Không cho phép các trang trong robot.txt nếu bạn cũng đã triển khai một phương pháp khác từ danh sách này.

Với tất cả các phương pháp này, Googlebot phải quay lại và thu thập dữ liệu các trang trước khi chúng bị xóa. Quá trình này có thể mất một vài tháng , đặc biệt đối với nhiều trang không phổ biến lắm. Nếu bạn muốn tăng tốc quá trình, hãy đăng nhập vào Google Search Console và sử dụng tính năng Tìm nạp dưới dạng Google cho mỗi URL. Lưu ý rằng đây là một quy trình thủ công với hạn ngạch mười lần tải mỗi ngày, do đó, nó sẽ không hoạt động đối với một số lượng lớn URL.

Google cũng có công cụ Xóa URL trong Search Console có thể tạm thời xóa URL hoặc thư mục khỏi Google trong 90 ngày. Bạn có thể sử dụng công cụ này để xóa URL khỏi kết quả tìm kiếm một cách nhanh chóng trước khi Googlebot có cơ hội thu thập dữ liệu chúng.

Ngay cả sau khi URL bị xóa khỏi kết quả tìm kiếm của Google, Google vẫn có thể hiển thị các URL là lỗi trong Google Search Console. Miễn là Google tìm thấy các liên kết đến URL, chúng có thể hiển thị dưới dạng lỗi thu thập dữ liệu sau khi chúng có trạng thái 404 hoặc 410. Điều này là hoàn toàn bình thường và hoàn toàn không làm tổn thương các trang khác trên trang web của bạn. Xem những gì John Mueller của Google nói về lỗi thu thập dữ liệu để biết thêm thông tin.


1

Có hai cách để xóa URL khỏi Google Search Engine

1 là

Nếu bạn không muốn thu thập dữ liệu trang của mình trong google, vì vậy bạn phải sử dụng công cụ Loại bỏ URL của công cụ quản trị trang web của Google để yêu cầu xóa trang Đây là cách

  • Đăng nhập công cụ quản trị trang web của bạn
  • đi đến cấu hình trang web
  • truy cập Crawler
  • đi tới tab truy cập Trình thu thập thông tin
  • dịch hại URL của bạn trong yêu cầu xóa mới

sau vài ngày url của bạn sẽ bị xóa khỏi công cụ tìm kiếm và không thể thu thập dữ liệu.

lần 2

Nếu trang web của bạn có nội dung mà bạn không muốn Google hoặc các công cụ tìm kiếm khác truy cập, hãy sử dụng tệp robots.txt và không cho phép thư mục của trang web đó.

bạn có thể sử dụng một trong các bước trên để xóa URL khỏi Google Search Engine

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.