Vâng, tôi nghĩ rằng bạn có trình thu thập thông tin tốt đọc robot.txt và làm theo chỉ thị. Và một số khác không tuân theo chỉ thị.
Và làm thế nào để bạn có kế hoạch để cung cấp url này? Bằng email, sử dụng Facebook hay Twitter? Tất cả các dịch vụ này thu thập thông tin bạn gửi. Gmail phân tích email bạn nhận được để cung cấp quảng cáo. Vì vậy, url của bạn sẽ được thu thập thông tin bằng cách nào đó.
Một số người sử dụng Thanh công cụ Google (hoặc bất kỳ thanh công cụ nào khác từ công cụ tìm kiếm). Có một tùy chọn (được kiểm tra theo mặc định nếu tôi nhớ rõ) cho phép thanh công cụ gửi tất cả các url bạn truy cập tới Google. Đây là một cách khác để Google xem web ẩn. Vì vậy, ngay cả khi bạn nói với người đó không chia sẻ url, anh ấy / cô ấy sẽ (nhờ thanh công cụ).
Tôi nghĩ rằng chúng ta có thể tìm thấy nhiều khả năng khác.
Vì vậy, bạn có thể thêm nó vào robot.txt nhưng cũng cung cấp thêm meta như noindex, nofollow, v.v.
biên tập:
Đề xuất của w3d về robot.txt có vẻ tốt với tôi. Vì vậy, đừng thêm nó vào robot.txt và cung cấp thẻ meta propre.