Lưu lượng truy cập trực tiếp từ một thị trấn cụ thể tăng vọt


9

Tháng trước tôi nhận thấy rằng các lượt truy cập trực tiếp trên trang web của chúng tôi đã tăng gần 150% trong khi tỷ lệ thoát cũng tăng đáng kể.

Sau khi đi sâu hơn, tôi có thể thấy rằng chúng tôi đã có gần 2000 chuyến thăm trực tiếp từ một thị trấn ở Connecticut có tên là Stamford, với tỷ lệ thoát là 100%!

Tôi đã tìm kiếm câu trả lời nhưng tôi chỉ có thể thấy rằng nó có thể được thực hiện với công cụ theo dõi thời gian hoạt động của chúng tôi; Bình minh.

Có ai biết / có bất kỳ kinh nghiệm nào với loại vấn đề này không, sự giúp đỡ nào được đánh giá cao

  • Tôi vừa nhận thấy rằng chúng tôi đang nhận được lưu lượng truy cập giống hệt nhau trong một thị trấn ở Anh và một thị trấn ở Scotland ... Điều này chắc chắn khiến tôi nghĩ rằng nó phải làm với công cụ giám sát thời gian hoạt động của chúng tôi.

Sombody có thể đã đánh dấu bất kỳ bài viết nào của bạn trong các trang mạng xã hội có lưu lượng truy cập ngắn hạn
AgA

Tôi nghi ngờ điều đó, chúng tôi đã có gần 2000 chuyến thăm từ Stamford, Edinburgh và Southend on Sea, tất cả đều có tỷ lệ thoát 100%. Ngoài ra các lượt truy cập vào trang chủ của chúng tôi trái ngược với bất kỳ bài viết / câu trả lời blog nào có thể đảm bảo bị trả lại.
Nhấp đúp chuột

Bạn có thể sẵn sàng tiết lộ tên của trang web? Tôi có một ý tưởng, nhưng cần phải biết thông tin đó. Chỉ là tên miền, thậm chí không phải ccTLD, nếu bạn không muốn nói.
Ellie Kesselman

Xin chào, đây là một liên kết nhỏ đến trang web của tôi (không muốn dán tên miền vì lý do tìm kiếm!) Bit.ly/WIHw2G
Nhấp đúp

Jack Tôi đã đăng một câu trả lời với một liên kết đến một trang web thảo luận về việc lọc các bot ra.
Anagio

Câu trả lời:


11

Xác định nguyên nhân của các đột biến giao thông cục bộ kỳ lạ không xuất hiện từ khách truy cập của con người đòi hỏi sự kiên nhẫn và công việc thám tử, nhưng các bước cơ bản là:

  1. Tìm hiểu xem nó đến từ đâu bằng cách sử dụng các công cụ có sẵn cho bạn (xem bên dưới).

  2. Xác định xem nó có nguy hiểm hay không bằng cách phân tích các nguồn của yêu cầu, tần suất, chính các tiêu đề yêu cầu và ảnh hưởng đến mạng và máy chủ của bạn.

  3. Quyết định xem có nên chặn nó trong Google Analytics không chỉ để ngăn nó xuất hiện trong số liệu thống kê của bạn (sử dụng bộ lọc Google Analytics), để chặn nó tại máy chủ để ngăn không cho nó truy cập trang web của bạn trong tương lai (sử dụng tường lửa hoặc dịch vụ như Cloudflare ) hoặc bỏ qua nó hoàn toàn.

Tôi sẽ không nêu chi tiết về ý nghĩa bảo mật ở đây vì bạn dường như quan tâm nhiều hơn đến ảnh hưởng của nó đối với dữ liệu phân tích của bạn. Dưới đây là một số quan sát về trường hợp cụ thể này, với một số gợi ý để xác định nguồn có thể và lọc ra lưu lượng truy cập không mong muốn trong Google Analytics:

Có lẽ không phải Pingdom

Các đột biến Google Analytics không có khả năng là lượt truy cập từ Pingdom vì hai lý do:

  • Kiểm tra HTTP của Pingdom không phân tích cú pháp JavaScript , vì vậy chúng sẽ không kích hoạt các tập lệnh Google Analytics được nhúng. (Tôi đã kiểm tra kỹ điều này với nhóm hỗ trợ của Pingdom ngày hôm qua, vì tôi cũng sử dụng Pingdom và rất tò mò. Đây là một trích dẫn trực tiếp từ email hỗ trợ của họ: "Vì kiểm tra HTTP của chúng tôi không thực thi bất kỳ mã JavaScript nào, Google Analytics sẽ không có bất kỳ mã JavaScript nào hồ sơ về các lượt truy cập của chúng tôi được thực hiện bởi các máy chủ thăm dò của chúng tôi vào trang web của bạn. " )

  • Pingdom hiện không có máy chủ ở Edinburgh. Họ liệt kê tất cả các máy chủ thăm dò của họ với địa chỉ IP và vị trí trên một trang trong bảng điều khiển của bạn (liên kết có tên "Máy chủ thăm dò" ở dưới cùng bên phải của tất cả các trang quản trị Pingdom khi bạn đăng nhập). Hai người duy nhất được liệt kê ở Anh ngay bây giờ là ở Manchester và London.

Nhưng bạn không cần phải tin lời tôi. Nếu các đột biến đang diễn ra và bạn muốn xác nhận rằng Pingdom không phải là nguyên nhân của các lượt truy cập đột ngột và tỷ lệ thoát tăng đột biến, bạn có thể:

  1. Tạm dừng các yêu cầu Pingdom đến trang web của bạn và xem liệu các lượt truy cập từ các khu vực đó có biến mất không. (Tôi nghi ngờ nó sẽ không tạo ra sự khác biệt.)

    - hoặc là -

  2. Thiết lập một trang tại example.com/pingdom/any-url-you-like, trỏ các yêu cầu Pingdom của bạn đến trang đó thay vì trang chủ của bạn và loại trừ /pingdom/thư mục con khỏi kết quả Google Analytics của bạn bằng cách (a) xóa mã theo dõi Analytics trên trang đó hoặc (b) sử dụng bộ lọc để loại trừ trang trong Google Analytics nếu bạn không thể xóa mã theo dõi trên cơ sở mỗi trang (ví dụ: nếu bạn đang sử dụng CMS bao gồm mã trên mỗi trang và bạn không có đủ quyền truy cập để thay đổi hành vi này).

Cách lọc yêu cầu với Google Analytics

Đây là chỉ cần thiết nếu bạn nghi ngờ rằng Pingdom không phân tích cú pháp JavaScript, và không có dấu hiệu cho thấy nó, nhưng lọc ra thăm từ Pingdom như thế này là một cách để kiểm tra xem bạn muốn khẳng định lại chính mình. Cũng rất hữu ích khi tìm hiểu cách thực hiện việc này để bạn có thể lọc các loại truy cập khác trong tương lai nếu bạn cần:

  1. Đăng nhập vào Google Analytics và nhấp vào liên kết "Quản trị viên" (trên cùng bên phải, bên cạnh "Trợ giúp")

  2. Nhấp vào tên miền hoặc tên trang web cho hồ sơ bạn muốn lọc. (ví dụ example.com)

  3. Nhấp vào tab "bộ lọc".

  4. Nhấp vào "+ Bộ lọc mới".

  5. Đặt tên cho bộ lọc và để lại "Bộ lọc được xác định trước" được chọn.

  6. Chọn "Loại trừ ... lưu lượng truy cập đến các thư mục con ... bằng" từ các hộp thả xuống.

  7. Nhập /pingdom/vào trường Thư mục con và đặt "Phân biệt chữ hoa chữ thường" thành "Không".

Đây sẽ là kết quả khi bạn hoàn thành:

Lọc Pingdom trong Google Analytics

Lưu các cài đặt này, sau đó bổ nhiệm lại kiểm tra Pingdom của bạn example.com/pingdom/any-page-or-url-that-existsvà Google Analytics hiện sẽ lọc các lượt truy cập vào URL đó. (Bạn vẫn sẽ nhận được báo cáo thời gian hoạt động của máy chủ cơ bản theo cách này, mặc dù Pingdom không còn trỏ đến trang chủ của bạn nữa.)

Nếu đó không phải là Pingdom, thì những bản hit đó đến từ đâu?

Bạn có thể thử tìm hiểu theo một số cách:

1. Nhìn vào mạng nào đang gửi cho bạn lưu lượng truy cập bị trả lại nhiều nhất. Để làm điều đó với Google Analytics, hãy xem phần Báo cáo chuẩn cho trang web của bạn, sau đó chọn Đối tượng> Công nghệ> Mạng từ phía bên trái. Cuối cùng, với chế độ biểu đồ hình tròn được chọn (mặc định), chọn "Đóng góp cho tổng số ... Bounce" từ trình đơn thả xuống bên phải:

Tổng số bị trả lại

Bạn sẽ thấy một danh sách các ISP hoặc nhà cung cấp mạng có người dùng đã đóng góp vào tỷ lệ thoát của bạn. Đôi khi, đây sẽ là một ISP nhỏ, cụ thể mà bạn có thể theo dõi đến một khu vực hoặc doanh nghiệp. Được trang bị tên của nhà cung cấp mạng gửi cho bạn lưu lượng truy cập nảy, bạn có thể chọn lọc mạng cụ thể đó khỏi Google Analytics như được mô tả ở trên, nhưng lọc theo mạng thay vì theo tên miền phụ.

Những lần khác, ISP hàng đầu được liệt kê sẽ là một nhà cung cấp lớn trong nước có thể có hàng triệu khách hàng và bạn sẽ không phải là người khôn ngoan hơn. Tại thời điểm đó, Google Analytics không thể giúp bạn đi sâu và xác định khách hàng nào của nhà cung cấp đó đang gửi lưu lượng truy cập bị trả lại (vì Analytics không còn bao gồm thông tin địa chỉ IP hoặc dữ liệu nhận dạng khác). Để có được loại dữ liệu đó, bạn có thể sử dụng một nhà cung cấp số liệu thống kê khác ghi nhật ký địa chỉ IP (như Clicky ) hoặc bạn có thể phân tích nhật ký máy chủ của mình, cũng ghi lại quyền truy cập theo địa chỉ IP:

2. Kiểm tra nhật ký truy cập máy chủ web của bạn để khám phá các lượt truy cập từ các trình thu thập thông tin đã biết và tìm kiếm quyền truy cập lặp lại từ cùng một địa chỉ IP. Một công cụ thống kê dựa trên web như AWStats có thể giúp bạn điều này. Nó khá phổ biến trong số các máy chủ web nhất định và họ có thể đã cài đặt nó cho bạn.

Đây là một số đầu ra mẫu từ AWStats . Hai phần có liên quan dành cho bạn là "Chủ nhà" và "Người truy cập Robot / Người nhện".

Phần máy chủ có thể cung cấp cho bạn manh mối về địa chỉ IP nào đang truy cập trang web để gây ra các lần thoát (và sau đó bạn có thể lọc các địa chỉ IP này trong Google Analytics). Phần robot / nhện có thể đưa ra gợi ý về bất kỳ trình thu thập thông tin hoặc tập lệnh tự động nào đang truy cập trang web của bạn có thể đang sử dụng JavaScript. Nếu bạn không chắc chắn cách đọc hoặc truy cập nhật ký máy chủ, hãy hỏi nhà cung cấp dịch vụ lưu trữ của bạn để được giúp đỡ.

Có địa chỉ IP không? Tìm ra ai đang sử dụng nó.

Nếu bạn quản lý để có được địa chỉ IP từ phần Máy chủ lưu trữ trong AWStats hoặc ở nơi khác, bạn có thể thực hiện tra cứu IP ngược để xác định ai có thể đang sử dụng địa chỉ đó.

Việc tra cứu IP ngược thường sẽ cung cấp cho bạn tên của nhà cung cấp dịch vụ lưu trữ mà bạn có thể báo cáo lạm dụng nếu bạn tin rằng các yêu cầu đó là độc hại. Hoặc nó có thể cung cấp cho bạn tên của một ISP trong nước mà khách hàng đang sử dụng tự động theo kịch bản để cố gắng khai thác trang web của bạn. Thông thường bạn có thể gửi báo cáo lạm dụng đến abuse@example.com, example.comtên của nhà cung cấp dịch vụ lưu trữ hoặc ISP. Và, đôi khi, nó sẽ cung cấp tên của một công ty cụ thể mà bạn có thể liên hệ để biết thêm thông tin.


Một số dịch vụ Pingdom thực thi JavaScript ngay bây giờ. Xem trang trợ giúp của họ để biết thêm thông tin và giải quyết công việc: help.pingdom.com/hc/en-us/articles/ mẹo
Justin

1

Pingdom có ​​hay không tùy thuộc vào cài đặt nào bạn đã đặt cho dịch vụ pingdom.

Nếu nó được thiết lập để thực hiện các yêu cầu http thì có, đó có thể là Pingdom. Nếu nó không sử dụng các yêu cầu http (chỉ ping hoặc các dịch vụ khác) thì đó sẽ không phải là Pingdom nhưng tôi sẽ cho rằng bạn đang sử dụng các yêu cầu http.

Tôi không sử dụng pingdom vì vậy tôi không biết liệu bạn có kiểm soát được tần suất kiểm tra của họ không. Nếu bạn có thể thì tuyệt vời. Nếu không, bạn có thể chuyển sang chỉ sử dụng các bài kiểm tra ping nhưng điều đó sẽ không đảm bảo rằng trang web đã hoạt động - chỉ có điều là máy chủ đã hoạt động.

Nếu bạn không thể giảm tần suất kiểm tra của pingdom và lượng lưu lượng truy cập mà nó tạo ra có vấn đề, thì bạn sẽ phải bỏ nó. Tuy nhiên, 2000 yêu cầu một tháng có thể sẽ không phải là vấn đề lớn - chúng sẽ thực sự làm rối tung thông tin phân tích trang web của bạn.

Bạn có thể cố gắng hoàn thành điều này bằng cách cô lập các yêu cầu Pingdom và tìm kiếm một mẫu. Sau đó, nếu bạn có tập lệnh phân tích tùy chỉnh, bạn có thể phát hiện mẫu và xóa địa chỉ IP tuân theo mẫu khỏi kết quả phân tích của bạn. Tuy nhiên, bạn có thể quyết định rằng điều này không đáng để gặp rắc rối và hãy nhớ rằng số lần truy cập sai bieng do Pingdom tạo ra mỗi tháng.

Tôi hi vọng cái này giúp được.


Cảm ơn, tôi đã nói chuyện với Pingdom và họ tin rằng nó không liên quan gì đến họ. Tôi có một phần mềm theo dõi khác gọi là chì cho phép tìm ra tên công ty dựa trên IP và dường như họ nghĩ đó là một công ty có tên NCC Group ( nccgroup.com ). Tôi hiện đang thảo luận điều này với các bộ phận kỹ thuật của họ.
Nhấp đúp chuột

1

Có một bài viết hay về cách xác định và lọc lưu lượng bot vào trang web của bạn Pingdom bao gồm đây là bài viết http://www.blastam.com/blog/index.php/2012/06/block-web-monitoring-bots-in -google-phân tích / quá lâu để sao chép ở đây

Bạn có biết rằng nếu bạn đang sử dụng một dịch vụ như Keynote để theo dõi hiệu suất trang web của mình, thì điều đó có ảnh hưởng đến số liệu web của bạn không? Các dịch vụ như Keynote, Gomez, AlertSite, Pingdom và nhiều dịch vụ khác sử dụng trình duyệt web thực sự để truy cập trang web của bạn nhiều lần trong ngày để đo hiệu suất thời gian tải. Họ đang tải trang web của bạn từ nhiều địa điểm trên khắp thế giới bằng các trình duyệt thực sự thực thi javascript theo dõi Google Analytics.


1

Có lẽ đó là Trang web Tự tin hay còn gọi là NCC Group.

Đối với trang web của chúng tôi, một chút điều tra với các bộ lọc GA đã tiết lộ tất cả các lượt truy cập bí ẩn từ Edinburgh và Stamford là từ một PC có Windows 7, IE8 nhưng ở độ phân giải 800x600 trông có vẻ hơi tanh.

Chúng tôi đã kiểm tra thông qua nhật ký của chúng tôi để biết bất kỳ lần truy cập nào với IE 8 và nhanh chóng tìm thấy mô hình lượt truy cập cứ sau 5 phút; đảo ngược DNS trên các IP đó và chúng từ Trang web Tự tin - điều này rất có ý nghĩa, vì chúng tôi đã yêu cầu họ làm điều đó.


-2

Điều này có thể không cần phải nói, nhưng nó QUITE có thể đây là hoạt động tự động không bị phát hiện. Bất kỳ hoạt động nào sai lệch nhiều (tỷ lệ thoát 100%) hoàn toàn có khả năng là hành vi bot mà bằng cách nào đó có được thông qua các bộ lọc bot của GA.

Nếu bạn có thể, hãy cắt những lượt truy cập đó bằng trình duyệt / đại lý; nếu tất cả đều là một tác nhân duy nhất (mà tôi đoán), điều đó sẽ củng cố tỷ lệ hoạt động tự động.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.