Liệu nó có ý nghĩa để trả lại 410
thay vì 404
khi một số trang đã bị xóa vĩnh viễn? Trong video này , Matt Cutts nói rằng Google đối xử với họ như nhau, nhưng có lý do nào khác để thực hiện 410
(ngoại trừ tính chính xác về kỹ thuật) không?
Liệu nó có ý nghĩa để trả lại 410
thay vì 404
khi một số trang đã bị xóa vĩnh viễn? Trong video này , Matt Cutts nói rằng Google đối xử với họ như nhau, nhưng có lý do nào khác để thực hiện 410
(ngoại trừ tính chính xác về kỹ thuật) không?
Câu trả lời:
Trên trang web của chúng tôi, gần đây chúng tôi đã thực hiện 410 lỗi cho các trang đã bị xóa vĩnh viễn. Chúng tôi có khoảng 40 triệu trang trong chỉ mục Google và được Googlebot thu thập thông tin với 2 triệu yêu cầu mỗi ngày.
Sau khi dọn dẹp cơ sở dữ liệu của chúng tôi, chúng tôi đã tìm thấy một số lượng lớn lỗi 404 tiếp tục hiển thị trong Lỗi thu thập dữ liệu trên Công cụ quản trị trang web. Khi chúng tôi chuyển sang 410 trạng thái thay vì 404, số lỗi mỗi ngày giảm đi một nửa trong khi tổng số yêu cầu được thực hiện giữ nguyên như nhau. Vì vậy, cuối cùng đã thu thập được nhiều trang thành công hơn mỗi ngày. Có vẻ như các trang có trạng thái 404 được thu thập thông tin nhiều lần trước khi bị xóa hoàn toàn khỏi chỉ mục.
Vì vậy, tôi sẽ nói, có chắc chắn đáng sử dụng 410 khi thích hợp để duy trì ngân sách Google Thu thập dữ liệu của bạn.
Có nhiều hơn Google trong thế giới này. Một 410 rõ ràng nói với một bot rằng tập tin đã biến mất. 404 không có. Một bot bền bỉ có thể tiếp tục cố gắng tìm 404 một cách vô thời hạn trong khi họ có thể ngừng cố gắng tìm 410 ngay lập tức, điều này sẽ khiến máy chủ của bạn rất hài lòng.
Bên cạnh việc có nhiều công cụ tìm kiếm hơn Google ngoài kia, cũng không có lý do gì để cho rằng Google sẽ không bao giờ thay đổi cách họ đối xử với 410 phản hồi. Thật vậy, có vẻ như điều đó đã xảy ra: thông tin Matt Cutts trích dẫn trong video là từ năm 2007, trong khi bài đăng này từ năm 2009 của John Mu trên các diễn đàn Trung tâm quản trị trang web của Google lại nói khác:
"Tôi đã theo dõi điều 404 vs 410 với đội ở đây. Như được đề cập bởi một số người khác ở đây & ở nơi khác, chúng tôi thường đối xử với họ như vậy trong quá khứ.
Tuy nhiên, sau khi xem cách các quản trị web sử dụng chúng trong thực tế, chúng tôi hiện đang coi mã kết quả 410 HTTP là "lâu dài" hơn so với 404. Vì vậy, nếu bạn chắc chắn rằng một trang không còn tồn tại và sẽ không bao giờ tồn tại nữa, sử dụng 410 có thể sẽ là một điều tốt. "
Vì vậy, có vẻ như Google hiện đang thực sự đối xử với 410 phản hồi khác với 404s.
Theo kinh nghiệm của tôi, Google không hiểu 410 mã lỗi.
Cách đây một thời gian, tôi đã thay đổi một trang web đầy đủ để tất cả các URL cũ là "410 Gone". Tôi không thể sử dụng chuyển hướng 301 vì không có mối quan hệ trực tiếp với một URL mới.
Tôi đã sử dụng một .htaccess
thông báo cho Google rằng các URL cũ đã biến mất, nhưng nó vẫn báo cho tôi biết có rất nhiều lỗi 404 trên trang web của tôi. Tôi đã kiểm tra các URL trong báo cáo lỗi thu thập dữ liệu và tất cả chúng đều là 410, không phải 404 như đã nêu.
Có nhiều hơn Google trong thế giới này.
Trích dẫn cho sự thật. Đưa ra yêu cầu của bạn, để thông báo cho bot (và có lẽ cả con người) rằng một trang đã bị xóa vĩnh viễn , tôi thực sự chọn 301
chuyển hướng đến một trang giải thích (nếu cần) tại sao nội dung bị xóa hoặc đưa bot / người dùng trở lại trang chỉ mục.
Các mã lỗi HTTP ít được biết đến thường không được hỗ trợ, hiểu hoặc triển khai trên bảng, vì vậy tôi thường tuân theo các mã lỗi để đảm bảo trải nghiệm duyệt web được mong đợi và hy vọng.
Việc chọn tùy chọn nào đi kèm phụ thuộc vào số lượng yêu cầu vẫn được gửi đến cho nội dung còn thiếu (hiện tại).