Câu hỏi được gắn thẻ «web-crawlers»

Một chương trình máy tính truy cập các trang web cho các mục đích khác nhau (để cạo nội dung, để cung cấp cho các công cụ tìm kiếm thông tin về trang web của bạn, v.v.)

2
Di chuyển chủ đề Disqus. Gotchas?
Tôi đã di chuyển một trang web sang một tên miền mới. Bản thân trang web này khá đơn giản (nó sử dụng Jekyll) và mọi thứ đều ổn - ngoại trừ việc di chuyển các luồng Disqus. Tôi đã thành công một phần - một số chủ đề đã …




5
Từ chối truy cập vào Archive.is
Tôi muốn từ chối archive.istruy cập vào trang web của tôi. (Tôi không muốn trang web này lưu trữ bộ nhớ cache của tôi mà không có sự đồng ý của tôi). Bạn có biết nếu nó có thể?



2
Trình thu thập dữ liệu Facebook không có tác nhân người dùng spam trang web của chúng tôi trong cuộc tấn công DoS có thể
Các trình thu thập thông tin đã đăng ký vào Facebook (ipv6 kết thúc bằng: face: b00c :: 1) đã đánh sập trang web của chúng tôi, chứng kiến ​​10 nghìn lượt truy cập chỉ trong 20 phút. Chúng tôi nhận thấy họ không có tác nhân người dùng trong …



2
Webcrawler của Google có tuân theo nhập HTML không?
Liệu googlebot - WebCrawler của Google - theo phía trình duyệt HTML nhập khẩu như sau? <link rel="import" href="header.html"> Tôi đang nghĩ đến việc lưu trữ nội dung web trên máy chủ web của mình để sử dụng chỉ thị này trong dự thảo W3C . Tuy nhiên, tôi lo …





Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.