Ẩn một tên miền con khỏi kết quả SEO của Google / Search Engine?


11

Tôi có một tên miền phụ mà tôi không muốn được liệt kê trong bất kỳ kết quả công cụ tìm kiếm nào. Hãy nói rằng tôi có:

  • http://www.example.com
  • http://child.example.com

Làm cách nào tôi có thể ẩn tất cả các URL của child.example.comtên miền hiện đang hiển thị trong kết quả của công cụ tìm kiếm?

Câu trả lời:


14

Trong thư mục gốc của trang web tên miền phụ, hãy thêm một tệp có tên robot.txt chứa:

User-agent: *
Disallow: /

Điều này sẽ báo cho các trình thu thập dữ liệu web không lập chỉ mục trang web. Họ không phải tuân theo, nhưng những người chính sẽ làm.


Xin chào, tôi tin rằng đây là điều tốt nhất. Và một điều nữa cho tôi biết, nếu tôi làm điều đó, sẽ mất bao lâu để có hiệu lực trên Kết quả Web? (ví dụ Google Tìm kiếm) Tôi có cần thời gian hay sẽ mất đột ngột?
夏 期

2
Nó sẽ được xác nhận vào lần tiếp theo khi người lập chỉ mục thu thập dữ liệu trang web. Điều này có thể là bất cứ điều gì từ vài phút đến vài tuần, tùy thuộc vào mức độ quan trọng của trang web của bạn. Bạn có thể di chuyển mọi thứ nhanh hơn bằng cách thêm trang web vào quản trị trang web tại Google và Bing và làm cho nó đọc lại robot.txt - bạn cũng có thể xóa các trang khỏi chỉ mục ở đó.
Paul

1
Nếu bạn muốn tăng tốc quá trình, bạn có thể gửi yêu cầu xóa tại google.com/webmasters/tools/removals cho Google và gửi URL tại bing.com/toolbox/submit-site-url cho Bing (vâng, đó là khuyến nghị phương pháp để loại bỏ các trang).
Kat

Bạn cũng nên thêm noindexvào chỉ mục và các trang khác trên tên miền phụ
Anagio

Làm thế nào để tôi làm khi có thư mục gốc phổ biến và tên miền phụ là động? stackoverflow.com/questions/21229235/ Lời
Gopi

6

Sử dụng tệp robot.txt trong tên miền phụ của bạn sẽ giúp ích (và Google sẽ tuân theo điều này), nhưng một bước khác bạn có thể thực hiện là chỉ định với tài khoản Google Webmaster mà bạn không muốn tên miền phụ này được lập chỉ mục. Bạn cũng có thể sử dụng thẻ meta trên tất cả các trang trong tên miền phụ:

    <meta name="robots" content="noindex">

Nếu đây là một trang web mà bạn chỉ đang sử dụng để thử nghiệm nội bộ, việc giới hạn khả năng hiển thị đối với một bộ địa chỉ IP được chỉ định trong tệp máy chủ ảo của bạn sẽ ẩn trang web đó.


Trong tất cả các trang ????? ồ không ..

@ 4lvin Nó được thực hiện linh hoạt từ phía máy chủ. Bạn chỉ cần mã nó một lần. Xin đừng nói với tôi là bạn đang mã hóa các trang HTML riêng lẻ.
Kenzo

LoL, thực sự "có". Bởi vì đây là hệ thống dịch vụ web rất cũ / cũ. (đó là lý do tại sao nó cần phải được đưa xuống) Nhiều trang bị cô lập bên trong. : D

@ 4lvin Ouch ... chúc may mắn với điều đó!
Kenzo

1
Thay vì nhúng thẻ noindex metavào mỗi trang, thay vào đó bạn có thể trả lại X-Robots-Tagtiêu đề phản hồi HTTP từ máy chủ của mình cho tên miền phụ được chỉ định - điều này bạn chỉ phải thực hiện một lần.
MrWhite

2

Các giải pháp từ Kenzo và Paul đều tốt, bạn có thể đặt các thẻ meta noindex trên các trang web của mình và thêm robot.txt để không cho phép robot.

Nhưng theo tôi, giải pháp tốt nhất là sử dụng xác thực mật khẩu trên tên miền phụ của bạn. Đây là giải pháp duy nhất bạn chắc chắn robot có thể truy cập và lập chỉ mục trang web của bạn. Nếu bạn sử dụng Apache, bạn có thể triển khai htpasswd .


2

... Hiện đang hiển thị trong kết quả SEO?

Các câu trả lời khác liên quan nhiều hơn đến việc chủ động ngăn chặn việc lập chỉ mục tên miền (phụ) (chủ yếu là những gì bạn đang hỏi trong câu hỏi) thay vì chủ động xóa các trang của bạn khỏi kết quả tìm kiếm, có thể là nhiều hơn những gì bạn đang theo dõi, đánh giá bởi câu hỏi khác của bạn .

Bạn vẫn cần chặn trang web của mình trong tệp robots.txt và cung cấp thẻ noindex meta (hoặc X-Robots-Tagtiêu đề phản hồi HTTP), như đã nêu trong các câu trả lời khác, nhưng bạn cũng cần chặn quyền truy cập vào các trang của mình, trả về mã trạng thái 404 hoặc 410.

Bạn có thể đọc thêm về điều này trên trang trợ giúp của Google Webmaster Tools:
Yêu cầu xóa nội dung

Khi bạn đã có tất cả những thứ này rồi thì bạn có thể sử dụng công cụ Xóa URL trong Công cụ quản trị trang web của Google. Tuy nhiên, điều này chỉ áp dụng cho các URL riêng lẻ, không phải toàn bộ trang web, nhưng đó là một sự khởi đầu. (Google tuyên bố rằng sử dụng robot.txt, noindex và phục vụ 404 là những yêu cầu để sử dụng công cụ loại bỏ GWT.)

Tuy nhiên, nếu bạn vẫn muốn người dùng thông thường có thể truy cập trang web bằng cách nhập URL, thì đó là một vấn đề - vì nội dung của bạn không còn khả dụng. Bạn có thể mật khẩu nó, như Zistoloen gợi ý, tuy nhiên điều này sẽ trả về 403 (Bị cấm) theo mặc định mà bạn sẽ cần ghi đè để trả về 404/410. Bạn có thể che giấu nội dung của mình, trả lại 410 cho Googlebot và cho phép mọi người khác nhập - nhưng mọi người nhấp vào kết quả trong SERPs thì sao?

Nhưng nếu bạn muốn Google xóa nội dung của bạn trong thời gian nhanh nhất có thể thì bạn cần xóa nội dung đó khỏi internet "Google".

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.