Tại sao các trang web này nhân bản nội dung của tôi và làm cách nào để ngăn chặn chúng?


14

Vì vậy, tôi đã tìm kiếm một trong những trang web của riêng mình trên Google: http://www.botlibre.com

và thật ngạc nhiên khi tôi tìm thấy một số bản sao của trang web của tôi, như:

http://83waystowasteyourtime.adidas.com

và:

http:// mediaiq.astral.comm

Câu hỏi của tôi là:

  1. Tại sao họ tạo bản sao của trang web của tôi? Một số loại kế hoạch SEO hoặc những gì? Những gì họ có thể nhận được?
  2. Làm thế nào để họ có một URL tại adidas.comastral.comm? Tôi cho rằng đó không phải là Adidas củng cố nội dung của tôi.
  3. Làm cách nào để tôi tắt các trang web này và ngăn mọi người ăn cắp nội dung của tôi? (trên Tomcat)

copyscape.com Có vẻ là một tài nguyên tốt để tìm nội dung trùng lặp, đó là cách tôi tìm thấy một số bản sao của trang web của mình.
Kzqai

Câu trả lời:


17

Được chứ. Đây là một điều khá kỳ lạ, nhưng không bi thảm như bạn nghĩ.

Tôi không chắc chắn mức chi trả sẽ là bao nhiêu. Điều này hoàn toàn không có ý nghĩa với tôi về lý do tại sao một người nào đó sẽ làm điều này. Tôi không thể thấy một lợi thế cho tin tặc. Tin tốt là khách truy cập đang truy cập trang web của bạn . Tuy nhiên, sẽ có một điểm nhấn từ quan điểm SEO vì vậy bạn muốn khắc phục điều này nhanh chóng.

Trang web của bạn, tôi giả sử, không phải trên một máy chủ được chia sẻ vì vậy nếu bạn truy cập trang web của mình bằng địa chỉ IP, nó sẽ vẫn hoạt động. Tôi đã thử nghiệm điều này và nó làm.

83waystowasteyourtime.adidas.com và mediaiq.astral.com là các tên miền phụ sử dụng một bản hack cũ cho phép bất cứ ai tạo một tên miền phụ cho bất kỳ tên miền không nghi ngờ nào. Bạn có thể đọc về nó ở đây: http://www.techrepublic.com/blog/it-security/watch-out-for-dns-sub-domain-hijacking/ Có nhiều trang web hơn nếu bạn đăng nhập vào tên miền phụ của Google .

Tin tốt là đây. Đây không phải là bản sao hoặc bản sao của trang web của bạn, chúng trang web của bạn. Mỗi tên miền phụ chỉ đến địa chỉ IP của bạn một cách cụ thể.

Bạn có thể làm một:

> dig 83waystowasteyourtime.adidas.com any

> dig mediaiq.astral.comm any

trên bất kỳ máy tính linux để xem.

Bạn có thể chống lại điều này, mặc dù tôi không chắc phương pháp nào sẽ hoạt động:

Giả sử bạn đã cài đặt Apache, bạn có thể chỉnh sửa tệp .htaccess của mình trong thư mục gốc của web và chèn đoạn mã sau.

Thêm phần sau vào đầu tệp để bật công cụ ghi lại.

RewriteEngine On

Chặn theo máy chủ:

RewriteCond %{HTTP_HOST} ^83waystowasteyourtime\.adidas\.com$ [NC]
RewriteRule .* - [F,L]

--hoặc là--

Chặn bởi người giới thiệu:

RewriteCond %{HTTP_REFERER} ^83waystowasteyourtime\.adidas\.com$ [NC]
RewriteRule .* - [F,L]

Bạn sẽ muốn kiểm tra những cái này và cho chúng tôi biết cái nào hoạt động. Xin vui lòng. Có thể chúng ta cần câu cá xung quanh cho một phương pháp khác.

Tất nhiên, bạn có thể thay đổi quy tắc viết lại và chuyển hướng chúng đến trang web của bạn trực tiếp, với:

RewriteRule .* http://www.botlibre.com [R=301,L]

--hoặc là--

Gửi họ đến địa ngục (hài hước) với:

RewriteRule .* http://www.hell.com [R=301,L]

... đó là một trang web thực sự. Nhưng bạn sẽ chuyển vấn đề lên chúng.

Tôi khuyên bạn nên chặn chúng.

Như @Martijn đã đề cập trong bình luận của anh ấy và nó rất đáng để bảo tồn, bạn có thể có các liên kết chính tắc trên mỗi trang để giúp bảo vệ bạn. Trong trường hợp này, liên kết sẽ trỏ đến trang liên kết được bật. Đó là công việc nhiều hơn, nhưng có vẻ như một ý tưởng tốt những ngày này.

<link rel="canonical" href="http://www.example.com/booger-eating-tyrants" />

Đồng thời, bạn có thể tiếp cận chủ sở hữu tên miền mẹ và cho phép họ tham gia cùng bạn trong trận chiến:

Adidas.com

Admin Name: Albert Pedraz
Admin Organization: adidas AG
Admin Street: Adi-Dassler-Strasse 1
Admin City: Herzogenaurach
Admin State/Province:
Admin Postal Code: 91074
Admin Country: DE
Admin Phone: +49.9132844584
Admin Email: adidas@role.noris.net

Tech Name: noris.net Hostmaster
Tech Organization: noris network AG
Tech Street: Thomas-Mann-Str. 16-20
Tech City: Nuernberg
Tech State/Province:
Tech Postal Code: 90471
Tech Country: DE
Tech Phone: +49.91193520
Tech Fax: +49.9119352100
Tech Email: hostmaster@noris.net

Astral.com

Admin Name: Van Tu Duong
Admin Organization: Bell Media Inc.
Admin Street: 9 Channel Nine Court,
Admin City: Scarborough
Admin State/Province: Ontario
Admin Postal Code: M1S 4B5
Admin Country: CA
Admin Phone: +1.5148702477
Admin Phone Ext:
Admin Fax:
Admin Fax Ext:
Admin Email: trademarks@bell.ca

Tech Name: Van Tu Duong
Tech Organization: Bell Media Inc.
Tech Street: 9 Channel Nine Court,
Tech City: Scarborough
Tech State/Province: Ontario
Tech Postal Code: M1S 4B5
Tech Country: CA
Tech Phone: +1.5148702477
Tech Phone Ext:
Tech Fax:
Tech Fax Ext:
Tech Email: trademarks@bell.ca

3
Và thêm một tiêu đề 301 vào trang web của bạn và thêm một canonicaltag vào các trang của bạn để tìm kiếm tìm kiếm bản gốc. Cũng có thể tận dụng điều này để lợi thế của bạn :)
Martijn

@Martijn Cảm ơn bạn đã bình luận! Tôi đã cập nhật câu trả lời với một ví dụ liên kết chính tắc. Điều này sẽ giúp mọi người trong tương lai.
Closnoc 5/03/2015

Cảm ơn về thông tin tuyệt vời. Tập tin nào tôi đặt "RewriteCond" chính xác? Ngoài ra bất kỳ câu trả lời cho câu hỏi số 1, tại sao? họ được lợi gì từ việc này?
James

1
@James Tôi cập nhật câu trả lời. Tôi đã trả lời câu hỏi 1, nhưng câu trả lời của tôi thấp hơn và có thể dễ bị bỏ qua. Tôi di chuyển nó lên đầu và mở rộng dựa trên nó một chút. Tôi cũng đã thêm tệp nào và tìm nó ở đâu - giả sử Apache (đây là mã Apache). Tôi không biết IIS nữa. Tôi đã có hơn một thập kỷ kể từ khi tôi làm bất cứ điều gì với IIS. Ghi nhớ, tôi không chắc bộ mã nào hoạt động, nhưng tôi nghi ngờ rằng phiên bản% {HTTP_REFERER} là chính xác. Vui lòng kiểm tra và cho chúng tôi biết kết quả là gì. Một lần nữa, giả sử Apache.
Closnoc

Xin lỗi, tôi đang sử dụng Tomcat, có ý tưởng nào để làm điều này trên Tomcat không?
James
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.