Tôi sẽ trả lời câu hỏi thứ 2.
Tôi đã tự hỏi liệu có cách nào nhanh hơn ngoài việc xóa các URL này khỏi các công cụ quản trị trang web của google không?
https://developers.google.com/webmasters/hacked/docs/clean_site
Google tuyên bố rõ ràng rằng việc xóa thông qua Google Search Console (tên mới của công cụ quản trị trang web) là nhanh nhất.
Nếu tin tặc tạo ra các URL hoàn toàn mới, người dùng có thể nhìn thấy, bạn có thể xóa các trang này khỏi kết quả tìm kiếm của Google nhanh hơn bằng cách sử dụng tính năng Xóa URL trong Search Console. Đây là một bước hoàn toàn tùy chọn. Nếu bạn chỉ cần xóa các trang và sau đó định cấu hình máy chủ của mình để trả về mã trạng thái 404, các trang sẽ tự nhiên thoát khỏi chỉ mục của Google theo thời gian.
Nhưng họ cũng hiểu rằng điều này không khả thi đối với một số trường hợp:
Quyết định sử dụng Xóa URL có thể sẽ phụ thuộc vào số lượng trang mới, không mong muốn được tạo (quá nhiều trang có thể khó sử dụng trong Xóa URL), cũng như thiệt hại tiềm tàng mà các trang này có thể gây ra cho người dùng. Để giữ cho các trang được gửi qua Xóa URL không bao giờ xuất hiện trong kết quả tìm kiếm, hãy đảm bảo các trang cũng được định cấu hình để trả về phản hồi Tệp không tìm thấy tệp 404 cho các URL không mong muốn / bị xóa.
Vì vậy, trong khi bạn có thể chặn các trang này trong tệp robots.txt - bạn không thực hiện một trong các bước khắc phục như được giải thích bởi google.
+
(cộng) trong đường dẫn URL, nó chỉ là một ký tự như bất kỳ ký tự nào khác.