Làm cách nào để chống lại những kẻ gửi thư rác giới thiệu Google Analytics?


43

Tháng trước tôi có rất nhiều người gửi thư rác trong số liệu thống kê GA của tôi. Số lượng của họ cao hơn ~ 10 lần so với số lượng khách truy cập hợp pháp (trang web của tôi chưa phổ biến lắm). Tôi đã bật một tùy chọn để ẩn những kẻ gửi thư rác đã biết trong cài đặt GA, nhưng nó không giúp ích gì cả. Có vẻ như những kẻ gửi thư rác này đang sử dụng các tập lệnh để spam trực tiếp vào GA (tức là chúng không được đăng nhập vào IIS của tôi).

Có bất cứ điều gì tôi có thể làm để ngăn chặn những kẻ gửi thư rác?

CẬP NHẬT 10 tháng sau, và họ bắt đầu spam bằng cách sử dụng tên trang đích giả mạo ... và Google vẫn không làm gì về điều đó.


1
Vui lòng kiểm tra xem các tệp nhật ký của bạn có lượt truy cập với spam giới thiệu và cho chúng tôi biết nếu bạn thấy bất kỳ. Nếu bạn có thể, vui lòng chỉnh sửa câu hỏi và bao gồm thư rác giới thiệu trong câu hỏi. Tôi nghi ngờ tôi biết câu trả lời rồi. Tôi đang thực hiện một số nghiên cứu và có một số lượng lớn hoạt động giới thiệu gần đây một số trong đó tôi đã tự mình trải nghiệm. Ngoài ra, nếu bạn đã cài đặt WordPress, vui lòng đảm bảo rằng nó được cập nhật. Một trong những trang web dường như cũng đang đi sau lỗ hổng WP. Ngoài ra, không truy cập bất kỳ trang web nào trong số này trừ khi bạn sử dụng trình duyệt văn bản như Curl.
Closnoc

@closetnoc, những kẻ gửi thư rác không đăng nhập vào máy chủ của tôi. Như tôi đã viết, họ đang spam trực tiếp vào GA. Tôi không sử dụng WP. "Bao gồm thư rác giới thiệu trong câu hỏi" - ý bạn là gì?
dùng626528

Tôi biết họ là ai và tôi đã đăng một câu trả lời.
Closnoc

Chắc chắn cách tốt nhất và dễ nhất để ngăn chặn điều này là sử dụng: giới thiệupamblocker.com Đó là thiết lập tự động các bộ lọc trong Google Analytics. Đã sử dụng nó trong nhiều tháng nay.
Rody van Sambeek

Việc đặt 'bộ lọc bot' thành đúng trong cài đặt phân tích google có giúp giải quyết vấn đề không? - lunametrics.com/blog/2014/08/07/ trên
sam

Câu trả lời:


7

Spam đang vượt khỏi tầm kiểm soát. Danh sách này đang phát triển và tốn thời gian và thậm chí không hiệu quả để thêm bộ lọc cho mỗi người gửi thư rác vì hầu hết trong số họ xuất hiện trong một vài ngày và sau đó biến mất và một bộ lọc mới xuất hiện.

Có rất nhiều thông tin sai lệch, lỗi phổ biến nhất là khuyến nghị sử dụng .htaccess , tệp này chặn quyền truy cập vào Trang web, mặc dù có một số trình thu thập dữ liệu (5 hoặc 6) có thể bị chặn, phần lớn thư rác không bao giờ truy cập trang web của bạn là Ghost Spam.

Cách tốt nhất để ngăn chặn loại thư rác này (Ghosts) là tạo bộ lọc tên máy chủ hợp lệ , thư rác ma sử dụng tên máy chủ giả hoặc không được đặt tên, vì vậy, với bộ lọc này, bạn không phải thêm bộ lọc vô tận, một bộ lọc sẽ mất quan tâm đến thư rác cũ và mới. . Đã sử dụng giải pháp này thành công trong 3 tháng

Thông tin thêm về phương pháp này tại đây:

https://stackoverflow.com/a/28354319/3197362


Tôi vui vì đây là câu trả lời được chấp nhận, nó thực sự nên được đánh giá cao hơn. Phần lớn những người giới thiệu spam trong Analytics là những người giới thiệu ma. Có một số bạn cần phải ngăn chặn .htaccess, nhưng đó là một trận chiến đang diễn ra để ngăn chặn chúng làm lệch các số liệu (Semalt là thủ phạm chính của điều này - bot hợp pháp của dì Fanny của tôi).
GeoffAtkins

Oh Carlos Tôi sắp giới thiệu hướng dẫn để chống spam trong trang web của bạn . Tôi biết nhận xét này sẽ được coi là một cách để SEO / bán nhưng thực tế không phải vậy. Tôi thực sự ngưỡng mộ đầu vào của bạn trên hướng dẫn đó.
Ooker

35

Được chứ. Không biết các trang web trong câu hỏi, tôi sẽ cố gắng giải thích một chút về những gì đang xảy ra và tôi sẽ chỉ cung cấp một vài liên kết.

Từ: http://www.cradlecloud.com/ban-block-blackhatworth-com-spam-referrals/

Tôi nhận được các tên miền sau liên quan đến phương pháp spam giới thiệu mới mà mọi người đang thấy muộn.

  • BlackHatWorth.com
  • Iskalko.ru
  • Rô-bốt
  • Oliveria.co
  • Kinh tế.co.
  • Darodar.com
  • ILoveVitaly.Com
  • Giág.com
  • Hulfingtonpost.com (Mới được thêm vào ngày 16 tháng 1 năm 2015)
  • Bestwebsitesawards.com (Mới được thêm vào ngày 3 tháng 2 năm 2015)
  • Ranksonic.info (Mới được thêm vào ngày 3 tháng 2 năm 2015)
  • Cenoval.ru (Mới được thêm vào ngày 6 tháng 2 năm 2015)
  • oo-6-oo.com (Mới- thêm ngày 25 tháng 2 năm 2015)
  • Humanorightswatch.org (Mới được thêm vào ngày 4 tháng 3 năm 2015)
  • S.click.al.co.com (Mới được thêm vào ngày 17 tháng 3 năm 2015 - Nghi ngờ)
  • www1.social-buttons.com (Mới được thêm vào ngày 23 tháng 3 năm 2015 - Nghi ngờ)
  • 4webmasters.org (Mới được thêm vào ngày 26 tháng 3 năm 2015 - Nghi ngờ)
  • Googlsucks.com (Mới- thêm ngày 04 tháng 4 năm 2015)
  • Addons.mozilla.org (Mới- thêm ngày 04 tháng 4 năm 2015 - Nghi ngờ)
  • Smallseotools.com (Mới được thêm vào ngày 13 tháng 4 năm 2015 - Nghi ngờ)
  • Theguardlan.com (Mới- thêm ngày 14 tháng 4 năm 2015)
  • Mua-cheap-online.info (Mới- thêm ngày 16 tháng 4 năm 2015 - Nghi ngờ)
  • Site1.free-share-buttons.com (Mới- thêm ngày 29 tháng 4 năm 2015 - Nghi ngờ)
  • Sanjosestartups.com (Mới- thêm ngày 25 tháng 5 năm 2015)
  • Trafficmonetize.org (Mới được thêm vào ngày 03 tháng 6 năm 2015 - Nghi ngờ)
  • Howtostopreferralspam.eu (Mới được thêm vào ngày 09 tháng 6 năm 2015 - Nghi ngờ)
  • Www10.free-social-buttons.com (Mới- thêm ngày 16 tháng 6 năm 2015 - Nghi ngờ)
  • Getitfree.us (Mới - thêm ngày 18 tháng 6 năm 2015 Quyền sở hữu không thể được xác định. Cảm ơn bạn - Trey Copeland)
  • Www6.free-social-buttons.com (Mới- thêm ngày 18 tháng 6 năm 2015 - Nghi ngờ)
  • Erot.co (Mới được thêm vào ngày 26 tháng 6 năm 2015 - Nghi ngờ)
  • 3g2upl4pq6kufc4m.onion (Mới- thêm ngày 04 tháng 7 năm 2015 - Nghi ngờ)
  • Traffic2money.com (Mới- thêm ngày 28 tháng 7 năm 2015 - Nghi ngờ)

Lưu ý: Các mặt hàng bị nghi ngờ - dường như tuân theo cùng một kiểu sở hữu và không được gắn với cùng một người phạm tội.

Một danh sách khá đầy đủ các giới thiệu thư rác được Piwik duy trì có thể được tìm thấy ở đây: https://github.com/piwik/referrer-spam-blacklist/blob/master/spammers.txt (Cảm ơn bạn - user2428118)

Để trích dẫn:

BlackHatWorth.com là một tên miền tương đối mới chỉ được tạo vào ngày 7 tháng 1 năm 2015 hiện đang được sử dụng để spam người giới thiệu. Trên thực tế, trang web spam giới thiệu này đang bị ẩn đằng sau tên của công cụ tìm kiếm mua sắm và hình ảnh phong cảnh đẹp.

... Địa chỉ IP của BlackHatWorth.com là 78.110.60.230 là cùng một địa chỉ được liên kết với các trang web spam giới thiệu khác ...

Trên thực tế, tên miền BlackHatWorth.com thuộc sở hữu của cùng một người Nga sở hữu các tên miền spam giới thiệu khác như ILoveVitaly.com, econom.co và Darodar.com. Tên chủ sở hữu tên miền được cho là Vitaly A Popov của Samara (thành phố), Samaraskaya Oblast (bang), Nga.

Bạn không thể chặn điều này!

Từ: http://www.blackmoreops.com/2014/12/19/darodar-com-referrer-spam/

Để trích dẫn:

Đây là một bản tóm tắt nhanh về cách Google Analytics hoạt động.

Vì vậy, bạn có được thiết lập trên GA và nhận mã từ họ. Mã này trông giống như UA-number-1 hoặc một số thứ như vậy. Số đó là số tài khoản trên mạng của bạn trên GA. Bây giờ, mã này và một chút javascript đi vào trang web của bạn. Bây giờ, ai đó truy cập trang của bạn và trình duyệt của họ chạy mã javascript đó.

Mã javascript đó là những gì mà Wikipedia ghi lại chuyến thăm của họ. Nó làm cho trình duyệt của họ nói chuyện với Google Analytics. Cụ thể, nó tạo ra một số loại yêu cầu HTTP nhất định mà Google ghi lại thông tin và sau đó GA hiển thị tóm tắt thông tin đó cho bạn.

Khá cơ bản đúng không? Vẫn còn với tôi? Được rồi, bây giờ, nếu tất cả chỉ là Javascript này, hãy gửi lượt truy cập vào lượt truy cập của họ tới họ, sau đó bất kỳ ai cũng có thể giả mạo điều đó. Bất cứ ai cũng vậy. Tất cả những gì tôi phải làm để làm cho GA của bạn hiển thị thông tin sai lệch là gửi thông tin giả mạo của tôi trực tiếp đến GA.

Tôi không cần phải truy cập trang web của bạn cả. Tôi không cần phải chạy javascript. Tôi chỉ cần sao chép các yêu cầu HTTP đó, công khai và vì vậy bất kỳ ai cũng có thể thấy chúng và cách chúng hoạt động. Chúng thậm chí còn được tài liệu khá tốt, công khai, bởi chính Google.

Vì vậy, bây giờ, giả sử tôi là một kẻ lừa đảo. Tôi muốn mọi người thấy trang web spam của tôi. Vậy, tôi phải làm gì? Tôi viết một đoạn mã nhỏ để gửi hàng ngàn hàng ngàn yêu cầu giả mạo này đến GA, và tôi chỉ đơn giản quay vòng qua tất cả các số UA, theo thứ tự, ngẫu nhiên, bất cứ điều gì. Tôi gửi một chuyến thăm giả, với một người giới thiệu giả mạo, và tên miền spam của tôi. Và đoán xem? Nó hiển thị trong màn hình Google Analytics của bạn.

Bạn thấy thư rác này giống như bất kỳ chuyến thăm bình thường khác. Bởi vì theo như GA, đó là một chuyến thăm bình thường. Tất cả những gì họ đang ghi là những yêu cầu HTTP, thường xuất phát từ mã javascript GA. Nhưng một yêu cầu là một yêu cầu, và thực hiện một yêu cầu giả là rất, rất dễ dàng.

Đó là những gì đang xảy ra. Tất cả những gì tôi cần là số UA của bạn và chỉ với một chút nỗ lực tôi có thể giả mạo một lượt truy cập vào trang web của bạn mà không bao giờ thực sự kết nối với trang web của bạn. Chuyến thăm giả mạo đó có thể có bất kỳ tên miền và bất kỳ người giới thiệu nào trong đó tôi chọn.

Đây là một cuộc tấn công vào Google Analytics, để quảng bá bất cứ trang web nào đang hiển thị. Bạn không thể chặn nó trên máy chủ của mình, vì máy chủ của bạn hoàn toàn không liên quan.

Bạn có thể làm hai việc: một, thiết lập bộ lọc như John Conde gợi ý; và hai, xem có cách nào để thông báo cho Google không. Cho rằng tôi không có câu trả lời, nhưng tôi có một ý tưởng.

[Cập nhật]

Điều này đang bắt đầu đạt được tỷ lệ cực kỳ cao từ hàng trăm lượt spam mỗi ngày cho đến quảng cáo đầy đủ như quảng cáo này:

nhập mô tả hình ảnh ở đây


2
@JohnMueller Cái này của tôi không ở trong vương quốc của bạn, nhưng bạn có thể gửi một số e-mail xung quanh để xem G có kiến ​​thức về điều này không? Cảm ơn trước!!
Closnoc

2
@JohnConde Cảm ơn! John Mueller có thể không biết về điều này, nhưng ai đó ở G nên. Ngay cả khi không có câu trả lời, ít nhất G cũng nên ngẩng cao đầu nếu họ chưa có. Đó là điều đúng đắn để làm cho tất cả chúng ta. Chúc mừng!
Closnoc

1
@JohnConde BTW- Tôi đã thấy (các) câu hỏi về điều này trên các trang web SE khác (và có thể liên quan). Tôi không ghi chú, nhưng có cách nào tốt để phát một ghi chú cho các Mod khác không? Hay tôi chỉ nên Google những tên miền này và tìm kiếm câu trả lời và bài đăng?
Closnoc

1
@joelmdev Bạn đã bỏ lỡ điểm không thể chặn được. Đây là một cuộc tấn công trực tiếp vào Google. Không ai có bất kỳ sự kiểm soát nào ngoại trừ Google. Họ đã được thông báo và hầu hết đã dừng lại.
Closnoc 19/2/2015

2
@Steve Tôi không thể thấy rằng có một khoản tiền lớn, tuy nhiên, phải có một nơi nào đó. Một cá nhân được đề cập trong câu trả lời ghét Google và ít nhất có thể muốn làm xấu hổ Google. Nhưng rõ ràng họ cũng đang sử dụng thư rác này để hướng lưu lượng truy cập đến các trang web khác nhau đang được đăng ký. Tôi thậm chí đã thấy một cái gì đó giống như một quảng cáo sử dụng phương pháp này. Thật là khó chịu như địa ngục !! Nó đang làm tổn thương những người vô tội nhiều hơn Google thực sự. Tôi cho rằng nó hoạt động ... rất buồn.
Closnoc 29/05/2015

5

Bạn có thể loại trừ chúng bằng cách tạo bộ lọc . Bạn cần tìm một cái gì đó đủ cụ thể để bạn không vô tình chặn khách truy cập tốt và thật tẻ nhạt khi bạn phải thêm thủ công từng người gửi thư rác nhưng điều này sẽ thực hiện thủ thuật.


Bạn có lời khuyên nào về IIS có thể giúp đỡ không? Tôi có thể giúp với Apache, nhưng OP dường như có IIS.
Closnoc

2
Nếu họ không truy cập trang web của họ, đó là những gì tôi tin rằng họ đã nói, thì đây sẽ không phải là một phương pháp hiệu quả để chặn họ. Hay tôi đã đọc sai câu hỏi?
John Conde

Tôi đọc nó vì OP đang nhận được lượt truy cập với spam giới thiệu.
Closnoc

2
Thật vậy, nhưng rõ ràng họ đang đánh GA trực tiếp thay vì đánh vào trang của họ. It seems these spammers are using scripts to spam directly to GA (i.e. they are not logged in my IIS).
John Conde

Được chứ. Bạn đúng rồi. Lỗi của tôi!! Tôi không chắc tại sao tôi không chọn cái này vì tôi chỉ đọc về một số thứ này ngay trước câu hỏi này. Tôi cũng bị tấn công bởi spam người giới thiệu và một bài viết được đề cập (một cách ngắn gọn) rằng không có mục nào trong tệp nhật ký của họ. Phương pháp mới thú vị.
Closnoc

4

Để trả lời trực tiếp câu hỏi tiêu đề của bạn "Cách chống lại kẻ gửi thư rác cho người giới thiệu", câu trả lời đơn giản nhất là bỏ Google Analytics và chuyển sang Piwik , tự động chặn tất cả thư rác của người giới thiệu theo mặc định .

Tôi nhận ra rằng bạn có thể đã quen với Google Analytics và muốn tiếp tục sử dụng nó, nhưng nếu bạn nhìn vào bức tranh lớn hơn, bạn có một tùy chọn khác hoạt động rất tốt. Piwik cũng có thể được định cấu hình để ghi nhật ký địa chỉ IP của khách truy cập nếu bạn muốn và nó không rò rỉ dữ liệu khách truy cập cho các công ty quảng cáo bên thứ ba có thể thu hút một số người dùng.


2
Nhân tiện, danh sách đen spam giới thiệu mà Piwik sử dụng là nguồn mở: github.com/piwik/referrer-spam-blacklist
Matthieu Napoli

cơ sở dữ liệu thư rác của họ khá nhỏ. thậm chí nó không phải là các miền được ghi chú trong báo cáo phân tích của tôi.
Don Dilanga

1

Đây là một quy tắc hoạt động trên IIS:

<rewrite>
  <rules>
    <rule name="abort referer spam requests" stopProcessing="true">
      <match url=".*" />
      <conditions>
        <add input="{HTTP_REFERER}" pattern="(semalt\.com)|(buttons\-for\-website\.com)" />
      </conditions>
      <action type="AbortRequest" />
    </rule>
    <!--The rest of your rules, if you have any-->
  </rules>
</rewrite>

2
Câu trả lời này không liên quan gì đến câu hỏi của OP vì những kẻ gửi thư rác đang spam trực tiếp Google Analytics qua máy chủ web của OP.
Alfred Myers

@AlfredMyer Nhận xét của bạn là một phần đúng vì một số người gửi thư rác sử dụng phương pháp máy chủ web, những người khác sử dụng phương pháp trực tiếp như bạn đề cập. Trong trường hợp sau, giải pháp duy nhất là thêm các bộ lọc trong Google Analytics để nhận báo cáo rõ ràng. Để ngăn chặn điều này, tôi thích Google sử dụng số nhận dạng duy nhất được băm dài hơn cho các tài khoản GA để những kẻ gửi thư rác không thể đơn giản lặp qua các số có sẵn và truy vấn lửa.
Flo

OP đặc biệt tuyên bố "... những kẻ gửi thư rác này đang sử dụng các tập lệnh để spam trực tiếp vào GA (tức là chúng không được đăng nhập vào IIS của tôi).". Vì vậy, đối với câu hỏi cụ thể này, họ không truy cập máy chủ web của anh ấy.
Alfred Myers

1

Trong trường hợp bạn vẫn đang tìm kiếm giải pháp và không thể hiểu các tài liệu tham khảo được thực hiện, thì đây là Hướng dẫn dứt khoát để loại bỏ thư giới thiệu, giờ đây là bản sửa đổi thứ 133 kể từ ngày 28 tháng 12 năm 2014: http://www.analyticsedge.com/2014 / 12 / loại bỏ giới thiệu-spam-google-phân tích /

TL; DR:

  • bộ lọc tên máy chủ hợp lệ sẽ xóa tất cả các giới thiệu ma (Bao gồm tên máy chủ mydomain.com)

  • một bộ lọc loại trừ cụ thể (hoặc chặn trang web) sẽ xóa danh sách các trình thu thập thư rác ngắn hơn nhiều (semalt.com | kambasoft.com | 7makemoneyonline.com | best-seo-offer.com | best-seo-solution.com | nút-cho -website.com | button-for-your-website.com | -musicas * -gratis | anticrawler.org | savetubevideo.com | ranksonic)

  • Phân đoạn nâng cao có thể được sử dụng để xóa chúng khỏi các báo cáo lịch sử của bạn.

Phân đoạn nâng cao có thể được nhập từ Thư viện giải pháp Google Analytics: https://www.google.com/analytics/gallery/#posts/search/%3F_.sort%3DDATE%26_.start%3D0%26_.type%3DADVANCED_SEGMENT % 26_.viewId% 3DGjpPQhFgS9aVzniXH4MTIg /


0

Đầu năm ngoái, tôi được giao nhiệm vụ tìm giải pháp tốt nhất có thể cho thư rác Google Analytics. Giống như mọi người khác, tôi đã thử các cách tiếp cận được đề xuất nhưng dường như không có gì hoạt động tốt cả. Vì vậy, tiếp theo tôi đã chuyển sang Trình quản lý thẻ của Google nhưng điều đó dường như cũng không giúp được gì nhiều. Thất vọng và bực tức, tôi quyết định xây dựng lại tập lệnh theo dõi Google Analytics, kết hợp các biện pháp đối phó với các hình thức spam phổ biến và gây phiền nhiễu nhất.

Mặc dù không hoàn hảo, sau ~ 1,5 năm xây dựng, thử nghiệm, gỡ lỗi và tái cấu trúc đều đặn, giờ đây tôi đã có một tập lệnh theo dõi Google Analytics khá đáng tin cậy, hoạt động tốt và có thể dễ dàng tùy chỉnh. Đối với những người muốn hoàn thành các số liệu, điều này hoạt động như một nét duyên dáng.

https://github.com/nickolasburr/intellect-ga-tracking

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.