Câu hỏi được gắn thẻ «web-crawlers»

Một chương trình máy tính truy cập các trang web cho các mục đích khác nhau (để cạo nội dung, để cung cấp cho các công cụ tìm kiếm thông tin về trang web của bạn, v.v.)






6
Công cụ tốt để thu thập dữ liệu trang web của tôi và giúp tôi tìm liên kết chết và các tệp không được liên kết [đã đóng]
Đã đóng cửa. Câu hỏi này không đúng chủ đề . Nó hiện không chấp nhận câu trả lời. Bạn muốn cải thiện câu hỏi này? Cập nhật câu hỏi để nó thuộc chủ đề cho Trao đổi ngăn xếp webmaster. Đóng cửa 6 năm trước . Tôi có một …


3
Tôi nên đặt tác nhân người dùng nào?
Có Ask bot, bộ tiêu đề này: Mozilla/2.0 (compatible; Ask Jeeves/Teoma) Xem xét điều này, tôi có các câu hỏi sau đây: Nếu tôi đang viết một trình thu thập dữ liệu web có tên Goofy, tôi nên sử dụng tác nhân người dùng nào? Sự khác biệt nếu tôi …



7
Làm thế nào để chặn nhện b Nikol
Hầu hết các chuyến thăm của tôi là từ những con nhện b Nikol. Tôi không nghĩ rằng nó giúp công cụ tìm kiếm chút nào vì vậy tôi đang nghĩ cách chặn chúng. Điều này có thể được thực hiện thông qua iptables? Tôi đang sử dụng nginx làm …





Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.