Phân tích: CloudFlare vs Google - Sự khác biệt nào là quá lớn?


10

Đã sử dụng CloudFlare cho một trong các trang web của chúng tôi khoảng một tuần nay và CloudFlare báo cáo số lượt xem trang khách truy cập thực hơn 450% so với Google Analytics (vì vậy đó không phải là bot hoặc các mối đe dọa bị chặn).

Tôi hiểu rằng sẽ có sự khác biệt vì CloudFlare đang đo lường tất cả các yêu cầu trang, Google Analytics sẽ thực hiện yêu cầu JavaScript sau khi trang đã tải xuống, vì vậy tôi đã chuẩn bị chênh lệch 20-30%, có thể 50%, nhưng 450%?

Có vẻ như có một vấn đề ở đâu đó. Tôi đã sử dụng trình gỡ lỗi Google Analytics cho chrome và mọi thứ dường như hoạt động tốt. Mã GA nằm trong đầu nên sẽ được kích hoạt khá nhanh chóng.

Là một khoảng cách lớn như vậy bình thường? Nếu vậy, tại sao, và nếu không, những gì trên trái đất đang gây ra nó?

cập nhật

Xin lỗi, tôi không nghĩ rằng tôi đã rõ ràng, tôi hiểu sự khác biệt giữa các số liệu thống kê CF và GA trước khi tôi bắt đầu với CF và dự kiến ​​chúng sẽ khác nhau. Đó là kích thước của sự khác biệt có liên quan.

CF tách biệt rõ ràng các bot & trình thu thập thông tin khỏi khách truy cập thường xuyên, do đó, con số tôi đang so sánh với GA chỉ là khách truy cập thông thường; Vì vậy, sự khác biệt nói rằng chỉ 1 trong 5 khách truy cập kích hoạt Google Analytics ?

"your CloudFlare visitor number is most likely higher"

Không làm điều đó công lý!


Tôi có cùng một vấn đề với sự khác biệt lớn hơn. Tôi nghĩ rằng số lượng khách truy cập có thể là lý do. Có bao nhiêu lượt xem trang báo cáo GA của bạn trong một tháng? Đối với tôi số lượt xem trang được báo cáo bởi CF trong một khoảng thời gian cụ thể là 223.000.000 trong khi số lượt báo cáo của GA là 22.000.000. Điều này chắc chắn không thể là do robot hoặc .js. Tôi nghĩ rằng điều này là do giới hạn dữ liệu của GA như được báo cáo bởi chính họ không đảm bảo cung cấp đúng dữ liệu cho hơn 10 triệu lượt xem trang mỗi tháng. Dù sao đây là những gì tôi nghĩ và tôi vẫn không chắc chắn.
Manoochehr

Một điều nữa: nếu một trong những hình ảnh của bạn được liên kết nóng, nó có thể kích hoạt lượt truy cập trên Cloudflare trong khi đó thì không. Đó là khó khăn. Tôi muốn nói rằng các lượt truy cập chắc chắn sẽ được Google Analytics ghi lại nhiều hơn so với Cloudflare.
David Wong

Câu trả lời:


4

CloudFlare thừa nhận điều này và đưa ra lời giải thích sau :

Phân tích CloudFlare so với các dịch vụ khác

Google Analytics và các chương trình phân tích dựa trên web khác theo dõi khách truy cập kích hoạt JavaScript. Do đó, các mối đe dọa, bot và trình thu thập thông tin tự động không được ghi lại do những khách truy cập này thường không kích hoạt JavaScript. Các dịch vụ này cũng không theo dõi khách truy cập rời khỏi một trang trước khi nó được tải đầy đủ hoặc đã tắt Javascript. CloudFlare theo dõi tất cả lưu lượng truy cập của bạn theo yêu cầu, vì vậy số lượng khách truy cập CloudFlare của bạn rất có thể cao hơn.

Hãy ghi nhớ: CloudFlare chỉ có thể theo dõi khách truy cập đi qua hệ thống CloudFlare, được thể hiện bằng một đám mây màu cam trên trang cài đặt DNS của bạn.

Họ cho rằng các phân tích của riêng họ "thường chính xác hơn các dịch vụ khác dựa trên JavaScript."


cảm ơn thời gian của bạn, nhưng tôi hiểu lý do, đó là tâm trí của tôi bị thổi phồng bởi quy mô của sự khác biệt! Tôi đã cập nhật câu hỏi của mình với một chút chi tiết hơn
CodeMonkey

4

Tôi đã quan sát thấy sự khác biệt tương tự khi so sánh nhật ký Apache với phân tích và đã thấy tỷ lệ (một ngày) là 1000: 1. Có thể từ xa bạn có một số cơ sở người dùng chặn Google-Analytics với các sản phẩm như NoScript và Ghostery hoặc hoàn toàn không chạy bất kỳ javascript nào. Tôi đã thấy rằng Piwik cung cấp các báo cáo tốt hơn và có thể được thiết lập sao cho trình chặn theo dõi không chặn tập lệnh của nó và người dùng không có javascript vẫn có thể được theo dõi thông qua sơ đồ theo dõi hình ảnh 1x1 pixel. Tuy nhiên, tôi không có kinh nghiệm thực tế với CloudFlare hoặc CDN nói chung, vì vậy tôi không biết liệu nó có ảnh hưởng đến báo cáo của Piwik hay không.


80% chặn GA có vẻ rất cao đối với tôi, điều đó nghe có vẻ bình thường với bạn không? Vì tò mò, bạn đã sử dụng gì để phân tích nhật ký apache và lọc ra các bot & mối đe dọa?
CodeMonkey

Tôi nghĩ rằng tỷ lệ phần trăm người dùng chủ động chặn các plugin sẽ ít hơn 5%, nhưng tôi không có cơ sở thực sự nào ngoài việc quan sát thói quen duyệt web của bạn bè, đồng nghiệp, v.v. Đối với nhật ký Apache tôi chỉ sử dụng AWStats - không ' T lọc bất cứ thứ gì, ít nhất không phải là cách tôi thiết lập nó. Tôi đã chuyển sang Piwik vì một trong các trang web của tôi không chạy bất kỳ tập lệnh nào và đối với các trang web khác, tôi chỉ thích các báo cáo hơn.
Paul

2

Không khó hiểu vì sao số Cloudflare lại cao hơn GA của bạn rất nhiều. Lý do là Cloudflare là một người đàn ông trung lưu. Hãy để tôi giải thích chi tiết.

Bạn thấy khi ai đó truy cập trang web sử dụng Cloudflare, người dùng sẽ gửi yêu cầu tới Cloudflare, đó là tất cả thông tin như tác nhân người dùng IP và những thứ khác. do đó, thậm chí không có vấn đề gì nếu người dùng sử dụng các tiện ích mở rộng như trình chặn tập lệnh hoặc những người khác Cloudflare sẽ biết rằng ai đó đã truy cập trang web của bạn.

Tại sao số lượng cao? Bạn thấy bất cứ khi nào một trang web được đăng ký hoặc tên miền chính xác là ông lớn như Google gửi bot của họ để thu thập thông tin. Hãy nhớ rằng không chỉ google gửi bot của họ mà còn rất nhiều người khác. Có rất nhiều cách để Cloudflare biết bot hoặc người thật nhưng tôi không chắc họ có tách hoặc xóa các lượt truy cập bot không.

Ngoài ra, các biện pháp để phân biệt có thể dễ dàng bị đánh lừa.

kết luận: bất cứ khi nào trang web của bạn được yêu cầu, nó sẽ thêm +1 vào tổng số.

thêm suy nghĩ: Tôi không thực sự chắc chắn nhưng nếu bạn thêm .js hoặc .png hoặc bất kỳ tệp nào khác trong webite của bạn. trình duyệt của bạn đưa ra yêu cầu đối với liên kết đã cho cũng có thể được tính là lượt truy cập vào trang web. ví dụ: nếu trong một trang có 10 bức ảnh và để tải tất cả, trình duyệt của bạn sẽ yêu cầu tất cả các bức ảnh đó có thể làm cho số lượt truy cập từ 1 đến 11. (10 cho các bức ảnh và một cho HTML trang web)


1

Tôi chưa bao giờ nhìn vào Analytics của Cloudflare cho đến bây giờ, nhưng bạn thực sự gần với Analytics hơn của tôi. Cloudflare báo cáo số lần truy cập duy nhất gấp 20 lần so với Google và tương đương với số lần xem trang.


Thật thú vị, vậy đó có phải là thứ bạn có khả năng điều tra thêm không?
CodeMonkey

Tôi đã xem qua nhật ký một chút và dường như chủ yếu là các bot gây ra sự khác biệt. Điều đó và tôi có trình kiểm tra "thời gian hoạt động" chạy trên Google Docs, trang này sẽ truy cập trang web cứ sau 5 phút.
nathangiesbrecht

1

Gần đây tôi đã phá hủy một trang web dựa trên WP của khách hàng và thắp sáng một trang web hoàn toàn mới. Đồng thời tôi đã thêm CF vào trang web mới của anh ấy. Trang web cũ của anh ta tiếp tục đánh máy chủ giới hạn bc của kẻ trộm hotlinking. Khi tôi tạo trang web mới, tôi đã cản trở họ bằng cách hủy tất cả các URL hình ảnh cũ. Bây giờ CF báo cáo lưu lượng truy cập lớn hơn nhiều so với GA và tôi tin rằng bc yêu cầu của mình đến máy chủ hiện là hình ảnh 404 không được tìm thấy bởi tất cả những tên trộm đang liên kết hình ảnh cũ của anh ta. Chỉ hai xu của tôi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.