Xác định nguyên nhân của các đột biến giao thông cục bộ kỳ lạ không xuất hiện từ khách truy cập của con người đòi hỏi sự kiên nhẫn và công việc thám tử, nhưng các bước cơ bản là:
Tìm hiểu xem nó đến từ đâu bằng cách sử dụng các công cụ có sẵn cho bạn (xem bên dưới).
Xác định xem nó có nguy hiểm hay không bằng cách phân tích các nguồn của yêu cầu, tần suất, chính các tiêu đề yêu cầu và ảnh hưởng đến mạng và máy chủ của bạn.
Quyết định xem có nên chặn nó trong Google Analytics không chỉ để ngăn nó xuất hiện trong số liệu thống kê của bạn (sử dụng bộ lọc Google Analytics), để chặn nó tại máy chủ để ngăn không cho nó truy cập trang web của bạn trong tương lai (sử dụng tường lửa hoặc dịch vụ như Cloudflare ) hoặc bỏ qua nó hoàn toàn.
Tôi sẽ không nêu chi tiết về ý nghĩa bảo mật ở đây vì bạn dường như quan tâm nhiều hơn đến ảnh hưởng của nó đối với dữ liệu phân tích của bạn. Dưới đây là một số quan sát về trường hợp cụ thể này, với một số gợi ý để xác định nguồn có thể và lọc ra lưu lượng truy cập không mong muốn trong Google Analytics:
Có lẽ không phải Pingdom
Các đột biến Google Analytics không có khả năng là lượt truy cập từ Pingdom vì hai lý do:
Kiểm tra HTTP của Pingdom không phân tích cú pháp JavaScript , vì vậy chúng sẽ không kích hoạt các tập lệnh Google Analytics được nhúng. (Tôi đã kiểm tra kỹ điều này với nhóm hỗ trợ của Pingdom ngày hôm qua, vì tôi cũng sử dụng Pingdom và rất tò mò. Đây là một trích dẫn trực tiếp từ email hỗ trợ của họ: "Vì kiểm tra HTTP của chúng tôi không thực thi bất kỳ mã JavaScript nào, Google Analytics sẽ không có bất kỳ mã JavaScript nào hồ sơ về các lượt truy cập của chúng tôi được thực hiện bởi các máy chủ thăm dò của chúng tôi vào trang web của bạn. " )
Pingdom hiện không có máy chủ ở Edinburgh. Họ liệt kê tất cả các máy chủ thăm dò của họ với địa chỉ IP và vị trí trên một trang trong bảng điều khiển của bạn (liên kết có tên "Máy chủ thăm dò" ở dưới cùng bên phải của tất cả các trang quản trị Pingdom khi bạn đăng nhập). Hai người duy nhất được liệt kê ở Anh ngay bây giờ là ở Manchester và London.
Nhưng bạn không cần phải tin lời tôi. Nếu các đột biến đang diễn ra và bạn muốn xác nhận rằng Pingdom không phải là nguyên nhân của các lượt truy cập đột ngột và tỷ lệ thoát tăng đột biến, bạn có thể:
Tạm dừng các yêu cầu Pingdom đến trang web của bạn và xem liệu các lượt truy cập từ các khu vực đó có biến mất không. (Tôi nghi ngờ nó sẽ không tạo ra sự khác biệt.)
- hoặc là -
Thiết lập một trang tại example.com/pingdom/any-url-you-like
, trỏ các yêu cầu Pingdom của bạn đến trang đó thay vì trang chủ của bạn và loại trừ /pingdom/
thư mục con khỏi kết quả Google Analytics của bạn bằng cách (a) xóa mã theo dõi Analytics trên trang đó hoặc (b) sử dụng bộ lọc để loại trừ trang trong Google Analytics nếu bạn không thể xóa mã theo dõi trên cơ sở mỗi trang (ví dụ: nếu bạn đang sử dụng CMS bao gồm mã trên mỗi trang và bạn không có đủ quyền truy cập để thay đổi hành vi này).
Cách lọc yêu cầu với Google Analytics
Đây là chỉ cần thiết nếu bạn nghi ngờ rằng Pingdom không phân tích cú pháp JavaScript, và không có dấu hiệu cho thấy nó, nhưng lọc ra thăm từ Pingdom như thế này là một cách để kiểm tra xem bạn muốn khẳng định lại chính mình. Cũng rất hữu ích khi tìm hiểu cách thực hiện việc này để bạn có thể lọc các loại truy cập khác trong tương lai nếu bạn cần:
Đăng nhập vào Google Analytics và nhấp vào liên kết "Quản trị viên" (trên cùng bên phải, bên cạnh "Trợ giúp")
Nhấp vào tên miền hoặc tên trang web cho hồ sơ bạn muốn lọc. (ví dụ example.com
)
Nhấp vào tab "bộ lọc".
Nhấp vào "+ Bộ lọc mới".
Đặt tên cho bộ lọc và để lại "Bộ lọc được xác định trước" được chọn.
Chọn "Loại trừ ... lưu lượng truy cập đến các thư mục con ... bằng" từ các hộp thả xuống.
Nhập /pingdom/
vào trường Thư mục con và đặt "Phân biệt chữ hoa chữ thường" thành "Không".
Đây sẽ là kết quả khi bạn hoàn thành:
Lưu các cài đặt này, sau đó bổ nhiệm lại kiểm tra Pingdom của bạn example.com/pingdom/any-page-or-url-that-exists
và Google Analytics hiện sẽ lọc các lượt truy cập vào URL đó. (Bạn vẫn sẽ nhận được báo cáo thời gian hoạt động của máy chủ cơ bản theo cách này, mặc dù Pingdom không còn trỏ đến trang chủ của bạn nữa.)
Nếu đó không phải là Pingdom, thì những bản hit đó đến từ đâu?
Bạn có thể thử tìm hiểu theo một số cách:
1. Nhìn vào mạng nào đang gửi cho bạn lưu lượng truy cập bị trả lại nhiều nhất. Để làm điều đó với Google Analytics, hãy xem phần Báo cáo chuẩn cho trang web của bạn, sau đó chọn Đối tượng> Công nghệ> Mạng từ phía bên trái. Cuối cùng, với chế độ biểu đồ hình tròn được chọn (mặc định), chọn "Đóng góp cho tổng số ... Bounce" từ trình đơn thả xuống bên phải:
Bạn sẽ thấy một danh sách các ISP hoặc nhà cung cấp mạng có người dùng đã đóng góp vào tỷ lệ thoát của bạn. Đôi khi, đây sẽ là một ISP nhỏ, cụ thể mà bạn có thể theo dõi đến một khu vực hoặc doanh nghiệp. Được trang bị tên của nhà cung cấp mạng gửi cho bạn lưu lượng truy cập nảy, bạn có thể chọn lọc mạng cụ thể đó khỏi Google Analytics như được mô tả ở trên, nhưng lọc theo mạng thay vì theo tên miền phụ.
Những lần khác, ISP hàng đầu được liệt kê sẽ là một nhà cung cấp lớn trong nước có thể có hàng triệu khách hàng và bạn sẽ không phải là người khôn ngoan hơn. Tại thời điểm đó, Google Analytics không thể giúp bạn đi sâu và xác định khách hàng nào của nhà cung cấp đó đang gửi lưu lượng truy cập bị trả lại (vì Analytics không còn bao gồm thông tin địa chỉ IP hoặc dữ liệu nhận dạng khác). Để có được loại dữ liệu đó, bạn có thể sử dụng một nhà cung cấp số liệu thống kê khác ghi nhật ký địa chỉ IP (như Clicky ) hoặc bạn có thể phân tích nhật ký máy chủ của mình, cũng ghi lại quyền truy cập theo địa chỉ IP:
2. Kiểm tra nhật ký truy cập máy chủ web của bạn để khám phá các lượt truy cập từ các trình thu thập thông tin đã biết và tìm kiếm quyền truy cập lặp lại từ cùng một địa chỉ IP. Một công cụ thống kê dựa trên web như AWStats có thể giúp bạn điều này. Nó khá phổ biến trong số các máy chủ web nhất định và họ có thể đã cài đặt nó cho bạn.
Đây là một số đầu ra mẫu từ AWStats . Hai phần có liên quan dành cho bạn là "Chủ nhà" và "Người truy cập Robot / Người nhện".
Phần máy chủ có thể cung cấp cho bạn manh mối về địa chỉ IP nào đang truy cập trang web để gây ra các lần thoát (và sau đó bạn có thể lọc các địa chỉ IP này trong Google Analytics). Phần robot / nhện có thể đưa ra gợi ý về bất kỳ trình thu thập thông tin hoặc tập lệnh tự động nào đang truy cập trang web của bạn có thể đang sử dụng JavaScript. Nếu bạn không chắc chắn cách đọc hoặc truy cập nhật ký máy chủ, hãy hỏi nhà cung cấp dịch vụ lưu trữ của bạn để được giúp đỡ.
Có địa chỉ IP không? Tìm ra ai đang sử dụng nó.
Nếu bạn quản lý để có được địa chỉ IP từ phần Máy chủ lưu trữ trong AWStats hoặc ở nơi khác, bạn có thể thực hiện tra cứu IP ngược để xác định ai có thể đang sử dụng địa chỉ đó.
Việc tra cứu IP ngược thường sẽ cung cấp cho bạn tên của nhà cung cấp dịch vụ lưu trữ mà bạn có thể báo cáo lạm dụng nếu bạn tin rằng các yêu cầu đó là độc hại. Hoặc nó có thể cung cấp cho bạn tên của một ISP trong nước mà khách hàng đang sử dụng tự động theo kịch bản để cố gắng khai thác trang web của bạn. Thông thường bạn có thể gửi báo cáo lạm dụng đến abuse@example.com
, example.com
tên của nhà cung cấp dịch vụ lưu trữ hoặc ISP. Và, đôi khi, nó sẽ cung cấp tên của một công ty cụ thể mà bạn có thể liên hệ để biết thêm thông tin.