Điều gì xảy ra nếu tôi cố gắng đặt cookie trên bot?


7

Tôi đang xây dựng trang web của mình để bao gồm một số cookie nhận dạng người dùng. Khi khách truy cập bấm chuông, tôi sẽ đặt cookie với id khách truy cập duy nhất (hướng dẫn) và thời gian truy cập và lưu bản ghi truy cập (bao gồm cả tác nhân người dùng, người giới thiệu (nếu có), v.v. , trong cơ sở dữ liệu của tôi. Tôi dự định kiểm tra từng người dùng để xem họ có cookie mà tôi đã đặt không, rồi tạo một bản ghi truy cập mỗi lần họ đến sau, để bao gồm nếu họ nhấp vào bất kỳ liên kết nào trên trang web của tôi.

Trang web này rất mới (chỉ khoảng một tuần tính đến ngày hôm nay), nhưng tôi đã theo dõi khách truy cập của mình trong nhật ký văn bản và tôi thấy rằng tôi có thể xác định các bot truy cập bởi các tác nhân người dùng của họ (bot Google và Bing / trình thu thập thông tin đã đi qua, cùng với một vài người khác).

Tôi nhận ra rằng họ có thể sẽ không chấp nhận cookie. Có ai biết điều này chắc chắn? Hay họ cũng thu thập cookie ngoài thông tin trang web?


Bạn đang cố gắng hạn chế thu thập dữ liệu trang web của mình bằng cách sử dụng cookie? Bots sẽ luôn thu thập dữ liệu trang web của bạn bất kể họ có chấp nhận cookie hay không.
Oleg

Không, tôi không cố gắng hạn chế bất cứ điều gì. Cookies chỉ là để phát hiện những người đã đến trang web trước đó và cố gắng theo dõi những gì họ làm trên trang web. Tôi chỉ tò mò nếu có ai biết nếu trình thu thập thông tin hoặc bot được biết là chấp nhận cookie, vì vậy tôi có thể lên kế hoạch cho điều đó.
Chuyên gia điện tử

Tôi không biết câu trả lời chắc chắn, nhưng tôi không dựa vào việc chấp nhận cookie của bot.
Oleg

2
Trình thu thập thông tin của Google thì không, vì họ không muốn nó lập chỉ mục nội dung cụ thể theo phiên. Xem blogpost này để biết chi tiết: googlewebmastercentral.blogspot.co.uk/2008/03/ . Tôi hy vọng các công cụ tìm kiếm khác có chính sách tương tự.
Jeremy Halliwell

Câu trả lời:


6

Hầu hết các bot không chấp nhận cookie (bao gồm Googlebot), tuy nhiên, một số bot làm.

Bạn gửi Set-Cookietiêu đề trong phản hồi, nhưng bot không gửi lại Cookietiêu đề trong các yêu cầu tiếp theo - vì vậy cookie bị mất hiệu quả. Cho dù Google có theo dõi xem trang web có đang đặt cookie hay không, chúng tôi không biết chắc chắn, nhưng tôi cá là họ có thể. Tuy nhiên, thông tin này không được sử dụng trong kết quả tìm kiếm.

Khi Googlebot truy cập trang web của bạn, có vẻ như họ chưa bao giờ truy cập trước đây, điều này phù hợp với bất kỳ người dùng thực sự nào đã tắt cookie của họ.

Đọc thêm: Googlebot có giữ phiên khi thu thập thông tin không?


Một cách để xử lý tình huống tạo ID khách truy cập duy nhất (hướng dẫn) là ... nếu cookie không tồn tại (người dùng mới hoặc cookie chưa được đặt vì bất kỳ lý do gì) sau đó thử đặt cookie với hướng dẫn thực sự của bạn , nhưng sử dụng hàm băm của tác nhân người dùng và địa chỉ IP làm hướng dẫn cho yêu cầu hiện tại (có thể phân biệt với hướng dẫn thực ). Nó không hoàn hảo (nó không hoàn toàn độc đáo), nhưng ít nhất nó cho phép bạn dễ dàng theo dõi các bot hơn và quan trọng là tránh đếm 1000 khách truy cập không thật (nếu bạn chỉ dựa vào cookie để đếm khách truy cập).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.