Một trang web khác đang phản chiếu và xếp hạng trên trang web của tôi trong kết quả tìm kiếm


55

Có một trang web không uy tín được gọi là thứ ba mươi đã phản chiếu hoàn toàn trang web của tôi và hiện có các liên kết xuất hiện trên Google ở ​​vị trí số 1 sử dụng nội dung của tôi. Tôi đã kiểm tra các tệp nhật ký của mình và nhận thấy rằng trang web này đã được tôi thu thập dữ liệu trong một thời gian và cũng có 10.000 liên kết từ trang web của họ đến trang web của tôi.

Tôi đã chặn quyền truy cập của người dùng được giới thiệu từ trang web này và đã báo cáo họ là spam web cho Google. Tôi cũng không biết tên miền.

Làm thế nào họ có được các liên kết hàng đầu trong Google (thậm chí vượt qua cả tôi) cho các chiến thuật bất chính như vậy? Các bước để loại bỏ hoàn toàn một vấn đề như thế này là gì?

CẬP NHẬT 28/8/2014:

Tôi nghĩ rằng tôi sẽ cung cấp một bản cập nhật về điều này vì tôi có thêm thông tin bây giờ. Vì vậy, ba mươi chỉ tên miền phụ của họ vào ip của tôi có tác dụng làm cho tên miền phụ của họ trông giống như trang web của tôi.

Trong một vài ngày, điều này không thành vấn đề vì sử dụng htaccess, tôi đã chuyển hướng tất cả HOSTS không phải tên miền của mình, trở lại tên miền của tôi, điều đó có nghĩa là tôi đã nhận được liên kết lưu lượng truy cập tên miền phụ của họ trên Google. Sau một vài ngày, ba mươi người đã thay đổi tên miền phụ của họ để quay lại trang web của họ để tôi không còn được hưởng lợi từ việc này.

Vì vậy, toàn bộ vấn đề là họ đã sử dụng nội dung của tôi để có thứ hạng hàng đầu trên Google và hiện đang trỏ các liên kết đó trở lại trang web của họ để thu hút thêm lưu lượng truy cập đến trang của họ.

Đó là một chiến thuật bẩn bởi một trang web bẩn. Hy vọng của tôi là Google trừng phạt hành vi như vậy.


3
Tôi đã chỉnh sửa phần mà bạn nghi ngờ động cơ của họ vì đó là ngoài chủ đề ở đây. Nhưng câu hỏi hay khác.
John Conde

1
Nhân bản trang web dường như là một thủ thuật mới, rất nhiều trang web bị sử dụng sai thời điểm này. Có tin tức tại Heise (tiếng Đức) về chủ đề này. Giải pháp thông thường (ngoài việc báo cáo trang web giả) dường như là, cung cấp nội dung đặc biệt cho địa chỉ IP của trình thu thập thông tin, vì vậy, ví dụ như chúng sẽ hiển thị một liên kết đến trang web thực của bạn.
martinstoeckli

1
Một lo lắng khác cho tương lai - bây giờ Google đã có lập trường gay gắt như vậy đối với webspam - là các đối thủ cạnh tranh sẽ cố tình đăng nội dung của tôi trên các trang web có tiếng xấu để làm tổn hại danh tiếng của tôi. Hoặc sẽ đăng các blog tìm kiếm spam vào trang web của tôi mà tôi không biết.
Marlboro Goodluck

3
@Jarrod Roberson: không hẳn vậy, có ai biết về một vụ kiện pháp luật không, nhưng có bao nhiêu giải pháp theo nghi thức?!
machineaddict

1
@JarrodRoberson Tuy nhiên, đây là vấn đề mà các quản trị web phải đối mặt và do đó rất có chủ đề cho trang web này vì hỏi nó ở đây sẽ nhận được phản hồi từ những người cũng đã phải đối phó với nó. Có vẻ như mọi người đã gửi một số giải pháp kỹ thuật cùng với các giải pháp pháp lý.
thanby

Câu trả lời:


45

Nếu họ chỉ phản chiếu trang web của bạn bằng cách cung cấp trang web của bạn thông qua tập lệnh proxy hoặc lấy lại nguyên văn HTML của bạn, bạn có thể thêm URL chuẩn cho các trang của mình. Điều này sẽ cho Google biết nội dung của bạn là nguồn ban đầu và để hiển thị URL của bạn trong kết quả tìm kiếm, không phải của họ.

Gửi yêu cầu DMCA tới Google. Họ hơi chậm với họ nhưng cuối cùng họ sẽ xóa những trang đó khỏi chỉ mục của họ.

Từ chối các liên kết là một động thái thông minh.

Tôi không biết nếu chặn người dùng là hữu ích mặc dù. Có thể đặt một tin nhắn ở đầu trang của bạn để họ cho họ biết bạn là trang gốc và trang kia là một sự gian lận có thể là một giải pháp tốt hơn.


2
URL Canonical không phải lúc nào cũng giúp. Tập lệnh nhân đôi trang web của tôi đã thay đổi URL chính tắc để trỏ đến trang giả mạo; vì vậy nó là vô nghĩa.
CaptainCodeman

28

Bạn có thể nộp đơn khiếu nại DMCA và nếu bạn ở Mỹ, bạn có thể nộp đơn kiện dân sự bản quyền.

Đây là đường dẫn đến một câu trả lời ngắn giải thích cách khiếu nại của DMCA có thể giúp đỡ bất cứ ai:

Bạn có phải ở Hoa Kỳ để nộp đơn khiếu nại DMCA không?

... và một số khác giải thích thêm ...

Bao nhiêu nội dung của bạn cần được sao chép trước khi bạn có thể nộp đơn khiếu nại DMCA?

Nếu bạn ở Mỹ, bạn có thể thuê một luật sư quen thuộc với các vấn đề bản quyền và yêu cầu họ gửi thư chấm dứt và thôi miên. Cung cấp cho họ 10 ngày (ngày thực tế và không phải ngày làm việc mặc dù ngày làm việc cũng sẽ ổn) để xóa nội dung. Bạn muốn chụp ảnh nhanh của trang web vi phạm để lấy bằng chứng và ảnh chụp nhanh trang web của bạn. Nếu bạn kiểm tra xem một trang đã bị xóa chưa, hãy kiểm tra trang trực tiếp và không tìm kiếm kết quả.

Nếu trang chưa bị xóa trong khoảng thời gian, bạn có thể nộp đơn kiện dân sự liên bang sẽ mất ít nhất 10.000 đô la để bảo vệ và hầu như không mất bất kỳ chi phí nào. Bạn sẽ ngồi ở ghế lái. Có khả năng một khu định cư có thể có ít nhất 10.000 đô la và có thể hơn thế nữa. Bạn có thể lấy lại chi phí của bạn. Điều quan trọng là cung cấp một tùy chọn miễn phí để khắc phục vấn đề do đó thư chấm dứt và ngừng hoạt động. Sau đó, bạn rõ ràng để nộp một vụ án mà không chịu trách nhiệm cho bị đơn.

Một lưu ý khác là bạn sẽ cần chứng minh các thiệt hại nếu bạn ra tòa. Mất lưu lượng tìm kiếm là thiệt hại. Tại đây, bạn sẽ làm việc với luật sư của mình để thu thập các số liệu minh họa việc mất lưu lượng truy cập và bạn sẽ cần kiếm tiền từ giá trị của lưu lượng truy cập đó. Tất nhiên, bạn có thể giả sử số lượng cao hơn ở đây ngay cả với tỷ lệ chuyển đổi% 100. Chỉ trong trường hợp, tôi sẽ thu thập số liệu về mất lưu lượng truy cập bằng Google Analytics và phần mềm phân tích tệp nhật ký của bạn ngay hôm nay và trong tương lai.

Xin lưu ý rằng việc nộp đơn kiện không khó hoặc rất tốn kém, đặc biệt là so với những thiệt hại bạn đang gặp phải hiện tại và trong tương lai. Vi phạm bản quyền đã giảm xuống gần đây, nhưng một số ít vi phạm bản quyền ngày nay táo bạo hơn nhiều. Chúng ta cần ngăn chặn những người này và cách thực sự duy nhất là đưa yếu tố chi phí vào chiến lược kinh doanh khiến việc vi phạm bản quyền không mang lại lợi nhuận.


2
Toàn bộ vấn đề bạn gặp phải là việc phát hiện ra ai đứng sau trang này hầu như không thể. Ý tôi là, họ sẽ là những kẻ ngốc để dễ dàng theo dõi trang web trở lại một cá nhân thực sự.
David Mulder

1
@DavidMulder Không có sidestepping. Một luật sư có thể yêu cầu các công ty cung cấp thông tin họ cần. Ngay cả một lá thư tử tế là đủ. Nếu thông tin không được cung cấp, thì luật sư có thể yêu cầu một sự lắng đọng trước tòa trước một thẩm phán với hình phạt tù nếu họ không xuất hiện, hoặc cung cấp thông tin được yêu cầu. Ở Mỹ, không có sự che giấu nào từ pháp luật hay dân sự. Điều này vẫn hoạt động quốc tế với một số ngoại lệ.
Closnoc

@closetnoc: Công ty có thể không muốn cung cấp thông tin một cách tự do, hoặc thậm chí có thể tự do làm điều đó. Không có gì chắc chắn rằng một tòa án sẽ đưa ra trát đòi hầu tòa hoặc dấu vết đó sẽ vẫn thuộc thẩm quyền của nó. Bạn có thể thấy mình trong một cuộc chiến pháp lý rất tốn kém và kéo dài với một bên thứ ba, người thậm chí có thể không biết tên thật của người phạm tội. Đánh giá bằng câu trả lời thấu đáo của bạn, bạn chắc chắn nhận thức được những trở ngại này, nhưng tôi phải đứng về phía David Mulder: Tôi nghĩ rằng bạn đang đánh giá thấp việc truy tìm trang web trở lại với một cá nhân khó khăn như thế nào.
Marcks Thomas

@closetnoc: Vâng, ngoại trừ nhà cung cấp dịch vụ lưu trữ không có thông tin chính xác. Và việc thanh toán có thể được thực hiện bằng thẻ tín dụng trả trước hoặc một số thẻ trả trước khác, thẻ tín dụng bị đánh cắp, bitcoin hoặc một số cơ chế giao dịch không thể truy cập khác. Ồ, và nhà cung cấp dịch vụ lưu trữ thậm chí có thể không ở Mỹ ngay từ đầu. Nó được gọi là internet, thích hay không.
David Mulder

@DavidMulder Tôi đánh giá cao những gì bạn đang nói. Tôi đang kinh doanh trong lĩnh vực bảo mật, đặc biệt là trong lĩnh vực nghiên cứu về cách tìm ra kẻ xấu. Hầu hết những gì bạn đang nói về sẽ là tiếng Trung Quốc, tiếng Nga hoặc tiếng Ba Lan. Vẫn có những cách để xác định những người này là ai thông qua các mẫu và như vậy. Họ cho đi. Đây là đặc biệt những gì tôi làm. Bạn phải cố gắng. Bạn không thể chỉ cuộn qua. Một luật sư Internet giỏi biết những người như tôi và làm thế nào để có được thông tin. Một chủ đề là tất cả những gì tôi cần và tôi thường nhận được nó. Nhưng nó có thể là một nỗ lực thực sự. Nhưng đó là trường hợp xấu nhất thứ.
Closnoc

27

Bạn có thể theo dõi IP của họ (hoặc IP) và trả lại nội dung hoàn toàn khác nhau để họ phản chiếu - bất cứ điều gì bạn thích. Bằng cách này, bạn có được không gian trống để quảng cáo bất cứ điều gì và bạn có thể sử dụng vị trí cao của họ trong Google để làm lợi thế cho mình.

Tôi đã từng sử dụng điều này để giải thích đơn giản cho người dùng trên trang web được nhân đôi rằng đây là tên miền sai. Bạn cũng có thể đăng một tiêu đề chuyển hướng HTTP đơn giản.


8
Tôi thực sự thấy điều này khá buồn cười vì một số lý do. +1
Mehrdad

1
họ có thể sẽ không sao chép các tiêu đề HTTP, nhưng bạn có thể gửi cho họ hoạt hình javascript và các biểu ngữ kiểu Marquee hài hước hét lên 'đây là một sự lột xác' và các gif hoạt hình cũ hay: P
Florian Fida

cũng có thể sử dụng thẻ meta và chuyển hướng javascript, một trong ba điều này gần như chắc chắn sẽ hoạt động. trong mọi trường hợp, đây không phải là một giải pháp ổn định và sẽ chỉ hoạt động cho đến khi họ phát hiện ra và bắt đầu làm việc chống lại nó. @Mehrdad, tôi đoán là buồn cười vì nó hack :)
Igor R

Nó cũng xảy ra với tôi thật buồn cười vì kẻ tấn công thực sự đang tự mở một lỗ hổng cho mình, bằng cách để nạn nhân đến sân chơi (kẻ tấn công) của mình, ngay cả khi anh ta có thể ngăn chặn nó bất cứ lúc nào. Điều này làm cho kẻ tấn công trông khá ngu ngốc.
Igor R

Vị trí cao của họ trong Google đang thay thế vị trí cao của trang web gốc, vì vậy nó không thực sự là "quảng cáo miễn phí".
CaptainCodeman

12

Một chút muộn đối với bạn nhưng ý tưởng tốt nhất để bảo vệ trang web của bạn (trong tương lai) sẽ là thế này: https://www.youtube.com/watch?v=I3pNLB3Cq24 (defcon 21, bảo vệ bằng số) giả mạo mã trả về để người dùng sẽ thấy nội dung nhưng bot sẽ

  • ném nội dung đi
  • bò trong vòng tròn
  • ngừng hoạt động

ý tưởng khác có thể - đảm bảo rằng người dùng của bạn không thấy bất kỳ điều nào trong số này:

  • hãy để họ lưu GB thông tin (trong khi chỉ có một vài kb trên máy chủ của bạn)
  • làm cho các bot tràn ngập bộ nhớ của riêng họ với các liên kết giả mạo
  • gửi nội dung giả mạo (100% boolsh * t - bạn cần viết nội dung - như "Obama có thai", "Người nhện 5 - vào mùa hè tới", ... để kẻ trộm của bạn có thể lưu trữ nó ...)
  • gửi các tệp giả mạo (như 42.zip, nếu họ không kiểm tra nội dung được sao chép, người dùng của họ sẽ vui vẻ -> Công cụ AV sẽ hiển thị rằng có gì đó không đúng -> người dùng sẽ bị p * ss * d ...)
  • để họ chờ thêm dữ liệu (kích thước tệp = 1-10 MB và gửi cr * p ngẫu nhiên với 1 Byte / s trở xuống)

những ý tưởng khác:

  • các liên kết được bảo vệ bởi Javascript (cũ, không sử dụng nữa? Nhưng nếu chúng không thay đổi, người dùng sẽ được gửi cho bạn (trong một thời gian))
  • rác động (sử dụng các bình luận hoặc các mục vô hình để làm cho các bot tải xuống thứ mà người dùng không thể nhìn thấy - các bot tốt sẽ không thuộc về điều này)
  • chặn các địa chỉ ip tải xuống quá nhiều / quá nhanh / sai cách (bot không hành xử như con người 1) mỗi liên kết trên mỗi trang 2) có một mô hình hoặc sự hỗn loạn trong cách họ chọn (các) liên kết tiếp theo)
  • sử dụng Javascript để chuyển hướng đến máy chủ của bạn nếu các tệp không được lưu trữ bởi máy chủ của bạn (không giúp chống trộm nhưng kẻ trộm phải xóa nó hoặc người dùng của họ sẽ không ở lại trang của họ - bạn có thể mã hóa nó thành các thói quen khác nhau (như giải mã nội dung ))

Tôi có mã riêng của mình mà tôi vẫn cần điều chỉnh một số khối chặn nhện. Tôi sẽ xem xét ý tưởng của bạn bởi vì đó là mẫu người của tôi! ;-) Lời khuyên tuyệt vời!
Closnoc

4
Vấn đề với việc chặn nhện và bot là bạn có thể không muốn tất cả chúng bị chặn. Ví dụ, Google rất quan trọng, nếu bạn muốn mọi người có thể tìm thấy trang web của mình. (Và vì Google có trang web của bạn trong bộ đệm, trình thu thập dữ liệu web không thực sự cần phải thu thập dữ liệu trang web của bạn để sao chép trang web).
trlkly

Nếu bạn cố tình đưa cho họ một cái gì đó thay thế - tôi thích câu trả lời của Igor về việc làm cho nó có lợi cho bạn (chuyển hướng / nói sai / lưu trữ quảng cáo) hơn là chống trả.
OJFord

2

Đây được gọi là Google Proxy Hack và nó cũng xảy ra với tôi.

Điều đầu tiên trước tiên:

  • Gửi khiếu nại DMCA đến Máy chủ web. Sử dụng liên kết này để tạo một khiếu nại được hình thành chính xác và gửi nó đến email hỗ trợ hoặc lạm dụng của chủ nhà. Nếu máy chủ lưu trữ ở Mỹ, họ phải gỡ xuống trang web. Ngay cả khi họ không có trụ sở tại Hoa Kỳ, họ vẫn có thể chọn gỡ xuống trang web. (Điều đó đã xảy ra với tôi một lần.)
  • Sử dụng công cụ DMCA của Google để yêu cầu URL được nhân đôi khỏi kết quả tìm kiếm.
  • Sử dụng Báo cáo cạp của Google để báo cáo lỗi trong thuật toán của Google.

Về cơ bản, đây là một thất bại về phía Google. Đối với tất cả những gì họ nói về việc xếp hạng dựa trên "nội dung gốc chất lượng", đây là một ví dụ đơn giản vô lý mà khá thẳng thắn chỉ là đáng xấu hổ.

Hy vọng nếu đủ người phàn nàn về điều đó, cuối cùng Google sẽ cùng nhau hành động và viết 10 dòng mã cần thiết để kiểm tra xem một trang web có phải là một tấm gương chính xác của một trang web được thiết lập trước đó hay không.

Ngoài ra, hãy lưu ý rằng việc sử dụng URL chuẩn không phải lúc nào cũng hoạt động trong trường hợp này. Nhiều tập lệnh proxy này thay đổi các URL chuẩn để trỏ đến trang nhân bản, do đó khiến chúng trở nên vô dụng.

Cuối cùng, hãy lưu ý rằng họ cũng có thể đã spam trang web chính của bạn bằng các liên kết rác để làm hỏng thứ hạng của bạn. (Điều này cũng xảy ra với tôi.)

Nếu bạn thực hiện một số suy nghĩ tìm kiếm và sáng tạo, có một số cách để chống lại. Tôi thực sự không nghĩ rằng nên xuất bản một danh sách đầy đủ ở đây vì điều đó chỉ giúp cuộc sống của tin tặc dễ dàng hơn.


1

Giống như những người khác đã đề cập, nộp đơn khiếu nại DMCA và vụ kiện dân sự bản quyền có thể là lựa chọn tốt nhất.

Đối với nội dung mới mà bạn xuất bản, bạn có thể xem xét thông báo về các cập nhật trang web của mình trên phương tiện truyền thông xã hội (Twitter, Facebook, v.v.) ngay khi bạn đăng. Dấu thời gian được ghi có thể là một chỉ số công bằng mà bạn đã viết trước trong trường hợp bạn phải chứng minh điều đó. Thông qua Google Webmaster Tools, bạn có thể thực thi cài đặt để Googlebot thu thập dữ liệu trang web của bạn thường xuyên . Giả sử, các công cụ tìm kiếm phổ biến lập chỉ mục các trang web của bạn thường xuyên (sử dụng toán tử trang, trang web: example.com, để tìm hiểu) ngày trong bản sao được lưu trong bộ nhớ cache có thể được sử dụng làm chỉ báo sơ bộ về thời điểm nội dung được xuất bản.

Ngoài ra, đối với nội dung mới mà bạn xuất bản, bạn có thể nhúng hình mờ trong hình ảnh và đặt bình luận trong các tệp JS cho biết bạn là chủ sở hữu ban đầu của các tệp đó.


Nếu có một bot sao chép nội dung, anh ta có thể chỉ cần đưa thông tin về quyền tác giả vào trang, vì vậy nội dung được sao chép sẽ chứa nội dung như "Điều này được tạo bởi Foo, tất cả các quyền" tạo ra một trường hợp thực sự rõ ràng (bạn có thể ẩn. rằng trong acrostic, nhưng là một bot, nó sẽ hoạt động ở dạng văn bản đơn giản và làm cho trường hợp của bạn mạnh hơn).
Ángel
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.