Nội dung trùng lặp là gì và làm cách nào tôi có thể tránh bị phạt vì nội dung đó trên trang web của mình?


36

Đây là một câu hỏi wiki chung, cộng đồng liên quan đến nội dung trùng lặp.

Nếu câu hỏi của bạn bị đóng như là một bản sao của câu hỏi này và bạn cảm thấy rằng thông tin được cung cấp ở đây không cung cấp câu trả lời đầy đủ, vui lòng mở một cuộc thảo luận về Pro Webmasters Meta .


  1. Google coi nội dung trùng lặp là gì?
  2. Cách tôi trình bày nội dung của mình có bị phạt nội dung trùng lặp không?
  3. Làm cách nào để tránh nội dung trang web của tôi bị coi là nội dung trùng lặp?

Câu trả lời:


31

Hướng dẫn quản trị trang web nội dung trùng lặp của Google xác định nội dung trùng lặp (cho mục đích tối ưu hóa công cụ tìm kiếm) là "các khối nội dung thực sự trong hoặc trên các miền hoàn toàn khớp với nội dung khác hoặc tương tự nhau".

Hướng dẫn của Google tiếp tục liệt kê các nội dung sau đây làm ví dụ về nội dung trùng lặp:

  • Diễn đàn thảo luận có thể tạo cả trang thông thường và trang bị loại bỏ nhắm mục tiêu vào thiết bị di động
  • Lưu trữ các mục được hiển thị hoặc liên kết thông qua nhiều URL riêng biệt
  • Các phiên bản chỉ dành cho máy in của các trang web

Hình phạt

Các công cụ tìm kiếm cần xử phạt một số trường hợp nội dung trùng lặp được thiết kế để spam chỉ mục tìm kiếm của họ, chẳng hạn như:

  • trang web cạp mà sao chép nội dung bán buôn
  • kỹ thuật quay bài viết đơn giản tạo ra nội dung "mới" bằng cách thay thế có chọn lọc các từ trong nội dung hiện có.

Khi các công cụ tìm kiếm tìm thấy nội dung trùng lặp, họ có thể:

  • Hình phạt toàn bộ trang web có chứa nội dung trùng lặp. (khi spam)
  • Chọn một trang làm nguồn chính của nội dung và hạ mức độ ưu tiên hoặc không lập chỉ mục cho trang khác với sự trùng lặp. (chung)
  • Không có hành động trừng phạt và lập chỉ mục nhiều bản sao của nội dung (hiếm)

Tránh trùng lặp nội bộ

Khi được hỏi về nội dung trùng lặp, Matt Cutts của Google nói rằng nó chỉ làm tổn thương bạn nếu nó trông có vẻ spam , tuy nhiên nhiều quản trị web sử dụng các kỹ thuật sau để tránh trùng lặp nội dung không cần thiết:

  • Đảm bảo rằng nội dung chỉ có thể truy cập được dưới một URL chuẩn
  • Nếu trang web của bạn phải trả lại cùng một nội dung trong nhiều URL (ví dụ: trang "chế độ xem in"), hãy chỉ định một URL chuẩn theo cách thủ công với phần tử liên kết trong tiêu đề tài liệu
  • Trong trường hợp trang web của bạn trả về nội dung tương tự dựa trên các tham số được mã hóa trong URL (ví dụ: sắp xếp danh mục sản phẩm), loại trừ các tham số URL trong Công cụ quản trị trang web của Google

Cung cấp nội dung

Xuất bản nội dung trên trang web của bạn đã được xuất bản ở nơi khác được gọi là cung cấp nội dung. Tạo nội dung trùng lặp thông qua việc cung cấp nội dung có thể OK:

  • Miễn là bạn được phép làm như vậy
  • Bạn nói với người dùng của bạn nội dung là gì và nó đến từ đâu
  • Bạn liên kết đến một nguồn ban đầu (Một liên kết sâu trực tiếp đến nội dung gốc từ trang với bản sao, không chỉ là một liên kết đến trang chủ của trang web nơi có thể tìm thấy bản gốc)
  • Người dùng của bạn thấy nó hữu ích
  • Bạn có một cái gì đó để thêm vào nội dung đó để người dùng thà tìm thấy nội dung đó trên trang web của bạn hơn những nơi khác. (Bình luận hoặc phê bình chẳng hạn.)
  • Bạn cũng có đủ nội dung gốc trên trang web của mình (ít nhất 50% gốc, nhưng lý tưởng nhất là 80% gốc)

Mặc dù Google không phạt đối với mọi trường hợp nội dung trùng lặp, ngay cả nội dung trùng lặp không bị phạt có thể không giúp bạn có được khách truy cập:

  • Bạn đang cạnh tranh với tất cả các bản sao khác ngoài đó
  • Google có thể sẽ thích nguồn gốc của nội dung và bản sao nội dung có uy tín nhất.

Google sẽ phạt nội dung trùng lặp được xuất bản trên trang web của bạn từ các nguồn khác nếu:

  • Nó dường như bị cạo hoặc đánh cắp (đặc biệt là không có sự ghi nhận).
  • Người dùng không phản ứng tốt với nó (đặc biệt là nhấp lại vào Google sau khi truy cập trang web của bạn.)
  • Có rất nhiều bản sao của nó ngoài đó mà không có lý do gì để gửi người dùng đến bản sao của bạn.
  • Bản sao của bạn không phải là bản gốc, có uy tín nhất hoặc có thể sử dụng nhiều nhất; và không có bất kỳ bình luận hay phê bình.
  • Trang web của bạn không có đủ nội dung gốc để cân bằng tất cả nội dung được xuất bản lại.
  • Bạn sao chép các trang thường xuyên trong trang web của riêng bạn đến nỗi Googlebot gặp khó khăn khi thu thập dữ liệu toàn bộ trang web.

Quốc tế hóa và nhắm mục tiêu theo địa lý

Nội địa hóa nội dung là một lĩnh vực trong đó sao chép nội dung có thể có lợi cho SEO. Hoàn toàn ổn khi xuất bản cùng một nội dung trên các trang web được nhắm mục tiêu tại các quốc gia khác nhau có cùng ngôn ngữ. Ví dụ: bạn có thể có một trang web của Hoa Kỳ, một trang web của Vương quốc Anh và một trang web của Úc, tất cả đều có cùng một nội dung.

Với một trang web cho mỗi quốc gia, thường có thể xếp hạng tốt hơn cho người dùng ở quốc gia đó. Ngoài ra, có thể phục vụ cụ thể cho người dùng ở mỗi quốc gia với những khác biệt nhỏ về chính tả, giá cả theo đơn vị tiền tệ của quốc gia hoặc tùy chọn vận chuyển sản phẩm. Để biết thêm thông tin về việc thiết lập trang web nhắm mục tiêu theo địa lý, hãy xem Tôi nên cấu trúc URL của mình cho cả SEO và bản địa hóa như thế nào?

Xử lý nội dung

Các trang web khác ăn cắp nội dung của bạn và xuất bản lại mà không được phép đôi khi có thể gây ra sự cố trùng lặp nội dung cho trang web của bạn. Các công cụ tìm kiếm làm việc chăm chỉ để đảm bảo rằng các trang web cạp khó có thể hưởng lợi từ việc sao chép nội dung của bạn . Nếu một trang web cạp đang gây ra sự cố cho bạn, thì có thể xóa trang web khỏi chỉ mục của Google bằng cách gửi yêu cầu DMCA với Google


0

Nói một cách đơn giản, nội dung trùng lặp được sao chép nội dung từ các nguồn web khác hoặc từ trang web của riêng bạn (cùng một nội dung tại nhiều trang).

Google có thể dễ dàng xác định xem đó là một nội dung độc đáo hay nội dung đạo văn.

Tốt hơn là tự viết nội dung cho trang web và cũng không lặp lại cùng một nội dung trong nhiều trang.

Nếu trang web của bạn có nội dung trùng lặp, bạn không thể ở trang đầu tiên của Google và bạn sẽ bị phạt theo hướng dẫn của Google và hơn nữa, bạn cũng sẽ không ở vị trí 100 trên SERP.


Bản sao không phải được sao chép từ các nguồn khác. Nó có thể trên trang web của riêng bạn, quá. Nếu nhiều URL có thể phân phát cùng một nội dung, bất kể nó nằm ở đâu ban đầu, đó là nội dung trùng lặp.
John Conde
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.