Google có thu thập dữ liệu các trang web Drupal trong chế độ bảo trì không?


10

Tôi đang sử dụng Aegir để sao chép các bản sao của trang web của mình dưới tên miền phụ, ví dụ test.mydomain.com. Những bản sao này đang ở chế độ bảo trì để tránh những kẻ gửi thư rác và những con mắt tò mò. Sau đó tôi sử dụng các bản sao này để thực hiện các thử nghiệm và công việc phát triển trước khi thực hiện các thay đổi đối với trang web chính của tôi mydomain.com

Nhưng tôi có đang làm tổn thương SEO của mình bởi sự tồn tại của các trang web nhân bản này không? Google có thu thập dữ liệu một trang web đã được đặt trong chế độ bảo trì không? Nó sẽ phạt tôi vì có quá nhiều tên miền phụ?


3
Câu hỏi này dường như lạc đề vì nó liên quan đến các thuật toán nội bộ của Google, không phải thứ gì đó liên quan cụ thể đến Drupal, cũng không phải thứ gì đó chúng ta có thể biết với bất kỳ mức độ tin cậy đáng kể nào.
Mołot

7
@ Mołot Làm thế nào điều này không thể vào chủ đề? Chế độ bảo trì là một tính năng của Drupal. Có các phương pháp để xử lý đúng kịch bản này. Hỏi xem Drupal có làm điều đúng đắn được sử dụng cho độc giả tương lai hay không.
mpdon Arena

2
@MPD ít nhất là một phần "Nó sẽ phạt tôi vì có quá nhiều tên miền phụ" hoàn toàn không liên quan đến Drupal. Các cách Google có thể được chuyển đến một trang trong chế độ bảo trì ở vị trí đầu tiên là Drupal cũng không liên quan.
Mołot

Câu trả lời:


21

Khi bạn đặt một trang web Drupal ở chế độ bảo trì, những người không phải là quản trị viên sẽ thấy trang chế độ bảo trì tiêu chuẩn (giả sử bạn xóa bộ nhớ cache sau khi thực hiện). Nếu bạn kiểm tra phản hồi, bạn sẽ thấy rằng nó được gửi lại với mã trạng thái HTTP là 503, từ RFC 2616 là:

503 Dịch vụ không khả dụng
Máy chủ hiện không thể xử lý yêu cầu do quá tải tạm thời hoặc bảo trì máy chủ. Hàm ý là đây là một điều kiện tạm thời sẽ được giảm bớt sau một số chậm trễ. Nếu biết, độ dài của độ trễ CÓ THỂ được chỉ định trong tiêu đề Thử lại sau. Nếu không có Retry-After được đưa ra, khách hàng NÊN xử lý phản hồi như đối với phản hồi 500.

Và từ blog Google Webmaster chính thức :

Nếu trang web của tôi ngừng hoạt động để bảo trì, làm cách nào tôi có thể yêu cầu Googlebot quay lại sau thay vì lập chỉ mục trang "xuống để bảo trì"?
Bạn nên định cấu hình máy chủ của mình để trả về trạng thái 503 (mạng không khả dụng) thay vì 200 (thành công). Điều đó cho phép Googlebot biết để thử lại các trang sau.

Vì vậy, điều đó đưa ra bằng chứng rằng Drupal thực hiện đúng và Google sẽ truy cập lại trang của bạn và các trang chỉ mục vào lần tiếp theo để nhận lại mã trạng thái không phải là 5XX.


2
Trang đăng nhập người dùng sẽ tiếp tục trả về mã trạng thái 200 OK (và cũng hiển thị các khối và thường không hiển thị trong chế độ bảo trì ( # 722434 )); tuy nhiên, robot.txt có lệnh Disallow: cho trang đăng nhập, vì vậy các bot hoạt động tốt sẽ vẫn không lập chỉ mục cho nó.
Garrett Albright

Đây là một điểm tốt liên quan đến chính trang bảo trì, mã phản hồi 503 có nghĩa là Google sẽ không lập chỉ mục trang bảo trì đó.
David Thomas

6

Trừ khi bạn đã thực hiện một số tùy chỉnh để cho phép nó, Google không thể thu thập dữ liệu trang web của bạn trong chế độ bảo trì.

Vì bạn cần phải đăng nhập để xem, googlebot sẽ thấy trang bảo trì được chỉ định.

Để biết thêm hướng dẫn từ Google, hãy xem các liên kết sau:


Tôi nghĩ vấn đề là bạn sẽ không muốn Google lập chỉ mục trang bảo trì.
Fuzzy76

2

Mối quan tâm của bạn:

Nếu bạn không biết liệu chế độ bảo trì có chặn "mọi thứ bạn muốn chặn" 100% hay không (nhưng) - nhưng đồng thời rất quan tâm đến việc "liệu ai đó như google có thể vẫn truy cập được không". ... Sau đó, chế độ bảo trì có thể là một lựa chọn tồi để chặn trang web phát triển của bạn ngay từ đầu.

Sự giới thiệu:

Cá nhân, tôi khuyên bạn chỉ cần thêm một .htpasswd vào các trang dev của bạn.

Thật đơn giản để tự động hóa ngay cả trong các triển khai aegir. Nó không bao giờ cản trở bạn, bởi vì trình duyệt của bạn và mọi công cụ dòng lệnh có thể bỏ qua nó cho bạn. Bạn có thể cho phép người khác tham gia. Nó chặn trang web hoàn toàn 100% cho google, v.v.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.