Liệu có ý nghĩa khi trả lại 410 thay vì 404 khi một số trang đã bị xóa vĩnh viễn?


16

Liệu nó có ý nghĩa để trả lại 410thay vì 404khi một số trang đã bị xóa vĩnh viễn? Trong video này , Matt Cutts nói rằng Google đối xử với họ như nhau, nhưng có lý do nào khác để thực hiện 410(ngoại trừ tính chính xác về kỹ thuật) không?


Tôi đã tự hỏi về điều này bản thân mình. Có vẻ như 410 không còn được sử dụng ở bất cứ đâu nữa.
Wogsland ngày

Câu trả lời:


7

Trên trang web của chúng tôi, gần đây chúng tôi đã thực hiện 410 lỗi cho các trang đã bị xóa vĩnh viễn. Chúng tôi có khoảng 40 triệu trang trong chỉ mục Google và được Googlebot thu thập thông tin với 2 triệu yêu cầu mỗi ngày.

Sau khi dọn dẹp cơ sở dữ liệu của chúng tôi, chúng tôi đã tìm thấy một số lượng lớn lỗi 404 tiếp tục hiển thị trong Lỗi thu thập dữ liệu trên Công cụ quản trị trang web. Khi chúng tôi chuyển sang 410 trạng thái thay vì 404, số lỗi mỗi ngày giảm đi một nửa trong khi tổng số yêu cầu được thực hiện giữ nguyên như nhau. Vì vậy, cuối cùng đã thu thập được nhiều trang thành công hơn mỗi ngày. Có vẻ như các trang có trạng thái 404 được thu thập thông tin nhiều lần trước khi bị xóa hoàn toàn khỏi chỉ mục.

Vì vậy, tôi sẽ nói, có chắc chắn đáng sử dụng 410 khi thích hợp để duy trì ngân sách Google Thu thập dữ liệu của bạn.


11

Có nhiều hơn Google trong thế giới này. Một 410 rõ ràng nói với một bot rằng tập tin đã biến mất. 404 không có. Một bot bền bỉ có thể tiếp tục cố gắng tìm 404 một cách vô thời hạn trong khi họ có thể ngừng cố gắng tìm 410 ngay lập tức, điều này sẽ khiến máy chủ của bạn rất hài lòng.


2
Mặc dù vậy, nó đi cả hai chiều: một bot thực sự nhảm nhí chỉ có thể nhận ra 200 và 404.
Peter Taylor

4
@Peter không chắc chắn rằng đó là vấn đề - nếu họ là người ngu ngốc và không hiểu mã HTTP thì điều đó có hại gì? Nếu bạn sử dụng 404 thì cả bot crappy và bot tốt sẽ tiếp tục yêu cầu trang, trong khi với 410 thì chỉ có một kẻ ngu ngốc.
DisgruntledGoat

1
Những gì @DisgruntledGoat nói. Xem Luật của Postel . Việc triển khai crappy đơn giản là không thể được tính đến; bạn sẽ làm gì, thử và tính toán cho tất cả chúng và từng quirks cụ thể của chúng, tất cả cùng một lúc? Có những trường hợp ngoại lệ hiếm hoi, như nói sự thống trị trình duyệt lâu đời của IE6, nhưng nói chung đơn giản là nó không đáng để bỏ công sức.
Su '

6

Bên cạnh việc có nhiều công cụ tìm kiếm hơn Google ngoài kia, cũng không có lý do gì để cho rằng Google sẽ không bao giờ thay đổi cách họ đối xử với 410 phản hồi. Thật vậy, có vẻ như điều đó đã xảy ra: thông tin Matt Cutts trích dẫn trong video là từ năm 2007, trong khi bài đăng này từ năm 2009 của John Mu trên các diễn đàn Trung tâm quản trị trang web của Google lại nói khác:

"Tôi đã theo dõi điều 404 vs 410 với đội ở đây. Như được đề cập bởi một số người khác ở đây & ở nơi khác, chúng tôi thường đối xử với họ như vậy trong quá khứ.

Tuy nhiên, sau khi xem cách các quản trị web sử dụng chúng trong thực tế, chúng tôi hiện đang coi mã kết quả 410 HTTP là "lâu dài" hơn so với 404. Vì vậy, nếu bạn chắc chắn rằng một trang không còn tồn tại và sẽ không bao giờ tồn tại nữa, sử dụng 410 có thể sẽ là một điều tốt. "

Vì vậy, có vẻ như Google hiện đang thực sự đối xử với 410 phản hồi khác với 404s.


4

Theo kinh nghiệm của tôi, Google không hiểu 410 mã lỗi.

Cách đây một thời gian, tôi đã thay đổi một trang web đầy đủ để tất cả các URL cũ là "410 Gone". Tôi không thể sử dụng chuyển hướng 301 vì không có mối quan hệ trực tiếp với một URL mới.

Tôi đã sử dụng một .htaccessthông báo cho Google rằng các URL cũ đã biến mất, nhưng nó vẫn báo cho tôi biết có rất nhiều lỗi 404 trên trang web của tôi. Tôi đã kiểm tra các URL trong báo cáo lỗi thu thập dữ liệu và tất cả chúng đều là 410, không phải 404 như đã nêu.


1

Có nhiều hơn Google trong thế giới này.

Trích dẫn cho sự thật. Đưa ra yêu cầu của bạn, để thông báo cho bot (và có lẽ cả con người) rằng một trang đã bị xóa vĩnh viễn , tôi thực sự chọn 301chuyển hướng đến một trang giải thích (nếu cần) tại sao nội dung bị xóa hoặc đưa bot / người dùng trở lại trang chỉ mục.

Các mã lỗi HTTP ít được biết đến thường không được hỗ trợ, hiểu hoặc triển khai trên bảng, vì vậy tôi thường tuân theo các mã lỗi để đảm bảo trải nghiệm duyệt web được mong đợi và hy vọng.

Việc chọn tùy chọn nào đi kèm phụ thuộc vào số lượng yêu cầu vẫn được gửi đến cho nội dung còn thiếu (hiện tại).


1
Tại sao cần phải giải thích loại bỏ có nghĩa là bạn cần 301 đến một URL khác với lời giải thích đó? Lời giải thích có thể nằm trên chính trang đó, với trạng thái 410 để các công cụ tìm kiếm hiểu rằng nó đã chết.
IMSoP
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.