WordPress với SOFT 404 trong Google Search Console (WMT) Điều gì gây ra Q82019309.com?


8

My anh em trang web mà tôi thiết kế cho anh ta một lúc có hàng trăm SOFT 404 của báo cáo trong Search Console của Google trước đây Webmaster Tools. Nói chung, tôi thấy việc sửa lỗi 404 dễ dàng nhưng điều này làm tôi hơi bối rối. Tất cả các lỗi mềm đang trả về một chuỗi lẻ chứa Q82019309.comtrong thư mục con không thường xuyên Aristocrattrong chuỗi /?=.

Các 404 thường trông giống như:

  • Được mã hóa: /search/%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Đã giải mã: /search/大奖总代Q82019309.com

Các liên kết từ thông tin cung cấp:

  • Được mã hóa: /?s=%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Đã giải mã: /?s=大奖总代Q82019309.com

Lúc đầu tôi tin rằng đây là một vấn đề riêng lẻ nhưng khi điều tra tôi phát hiện ra rằng vấn đề này thực sự ảnh hưởng đến hàng ngàn trang web và ai đó phải biết nguyên nhân. Khi tôi Google Q82019309.com WordPress hoặc Aristocrat Q82019309.com tôi bị choáng ngợp với số lượng kết quả, bao gồm một số trang web có uy tín cao như:

Câu hỏi:

Vì vậy, những gì gây ra các lỗi 404 mềm với chuỗi Q82019309.comcó hoặc không có Aristocrat.


Trang web của bạn đã bị hack. Q82019309.com bị xâm phạm.
Closnoc

Truy cập trang web Q82019309.com cho biết đây là một trang web tấn công và tôi đồng ý rằng nó tinh ranh nhưng tôi thấy khó tin rằng tất cả các trang web này đã bị hack bằng thứ gì đó sử dụng chuỗi truy vấn trong tìm kiếm. Có hàng trăm ngàn trang web đang báo cáo Q82019309.com ... những trang web có uy tín cao ... chắc chắn những trang này không bị hack?
Simon Hayter

Các liên kết dường như là tất cả spam. Một hồ sơ rất điển hình. Đồng thời, điều này dường như là cụ thể cho các trang web WP. Điều này có vẻ là khá gần đây, chỉ trong vài ngày (4 hoặc hơn). Kiểm tra cài đặt WP để đảm bảo mọi thứ được cập nhật. Xem: web.nvd.nist.gov/view/vuln/ trên
Closnoc

Được phát hiện hơn một tuần trước ngày 13.
Simon Hayter

Hãy nghĩ rằng tôi sẽ phải xem qua các lỗi.log và access.log để xác định xem ai đó đã cố gắng hoặc xâm nhập thông qua một vụ hack mới.
Simon Hayter

Câu trả lời:


2

Chúng tôi đã gặp vấn đề tương tự tại Wisepops.com kể từ ngày 3 tháng 1 năm 2017.

Google đang phàn nàn về Soft 404 ngay cả khi lập chỉ mục bị tắt trên các trang này. Trang tìm kiếm Wordpress theo mặc định meta này:

<meta name="robots" content="noindex,follow">

Tôi quyết định tạo các trang tìm kiếm mà không có kết quả trả về mã HTTP 404. Vì truy vấn tìm kiếm nằm trong URL, nên xử lý theo cách này là ổn.

Đối với Wordpress, tôi đã thêm vào cuối chức năng của chủ đề của mình.php:

/*---------------------------------------------------*/
/*  SEARCH PAGES WITHOUT RESULTS SEND 404 HTTP CODE  */
/*---------------------------------------------------*/
function wisepops_search_404_code() {
    if (is_search() && !have_posts()) {
        header($_SERVER['SERVER_PROTOCOL'] . ' 404 Not Found');
        $GLOBALS['wp_query']->is_404 = true;
    }
}
add_action('get_header', 'wisepops_search_404_code');

@ Wisepops.com: Tôi gặp vấn đề tương tự với cuộc tấn công Tìm kiếm-Spam ngu ngốc này. Cảm ơn bạn vì mật mã! Nó làm việc rất lớn đối với tôi! Bây giờ tìm kiếm trống trả về một 404 sạch và điều đó thật tuyệt. Trân trọng, Mitschu
Mitschu

Điều này có gửi một người dùng thực sự thực hiện tìm kiếm và không có kết quả nào cho trang 404 không?
brandozz

1

Có vẻ như tôi có thứ gì đó đang liên kết đến chức năng tìm kiếm trang web của bạn với các truy vấn xấu. Những truy vấn tìm kiếm nhận được "không tìm thấy kết quả". Googlebot đang tìm các liên kết đó và bạn đang cho phép Googlebot thu thập dữ liệu tìm kiếm trang web của bạn. Do "không có kết quả", Google đang phát hiện chúng là "404 mềm".

Để Google thu thập dữ liệu kết quả tìm kiếm trang web của bạn là một điều không nên. Nó có thể khiến toàn bộ trang web của bạn bị Google phạt. Xem Matt Cutts: Kết quả tìm kiếm trong kết quả tìm kiếm . Bạn không cho phép thu thập tất cả các kết quả tìm kiếm bằng robot.txt :

Disallow: /search
Disallow: /?s=

Sau đó, Googlebot sẽ không thu thập dữ liệu các URL đó và báo cáo lỗi ở đó.


Stephen, đã yêu thích lại 404s mềm này? Tôi thực sự đã thêm nó vào tệp robots.txt của mình và đánh dấu tất cả các 404 mềm của tôi trên trang tìm kiếm là cố định. Khi tôi xác minh, tôi sẽ đánh dấu điều này là chính xác. Nhưng đây dường như là giải pháp tốt nhất.
brandozz

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.