Sự đồng thuận trong việc xử lý phân trang năm 2019 trên các tập kết quả lớn là gì?


8

Theo nghiên cứu của tôi, các phương pháp cũ để hợp nhất các URL được phân trang thành một không được khuyến nghị nữa.

Cách cũ:

Sử dụngrel=prev/next , nhưng:

"Rel = trước / tiếp theo không phải là tín hiệu lập chỉ mục nữa" ( Google WebmasterBlog )

Sử dụng noindex,followtrên các trang được phân trang , nhưng:

"Nếu chúng tôi thấy noindex ở đó lâu hơn chúng tôi nghĩ trang này thực sự không muốn được sử dụng trong tìm kiếm nên chúng tôi sẽ xóa nó hoàn toàn. Và sau đó chúng tôi sẽ không theo các liên kết. Vì vậy, trong noindex và theo dõi là về cơ bản giống như một noindex, nofollow. " - John Mueller

Có nghĩa là các trang này sẽ không phân phối PageRank và thậm chí có thể loại trừ khỏi việc thu thập thông tin, điều này sẽ khiến các liên kết mới trên các trang này sẽ không được phát hiện.

Sử dụng rel = canonical cho trang đầu tiên , nhưng:

"Googlebot sau đó sẽ không lập chỉ mục các trang xuất hiện xa hơn trong chuỗi, cũng như không thừa nhận các tín hiệu cho nội dung được liên kết từ các trang đó" SearchEngineJournal

Điều này nghe có vẻ như noindex,nofollowvấn đề, xem ở trên.

Sử dụng trang "Xem tất cả" , nhưng:

Đó không phải là một giải pháp áp dụng cho các trang lớn hơn, mà sẽ có hàng ngàn liên kết để hiển thị, vì lý do hiệu suất.


Vì vậy, có vẻ như phương pháp duy nhất cho các tập kết quả lớn là không làm gì cả, ngoại trừ đưa ra cho GoogleBot một số gợi ý, ví dụ:

  • Sử dụng rel=prev/next, bởi vì nó sẽ không bị tổn thương.
  • Sử dụng các tham số URL tiêu chuẩn như page=2 để dễ nhận biết.
  • Sử dụng gợi ý trong tiêu đề để báo hiệu phân trang, ví dụ Shoes - Page 2
  • Hãy cầu nguyện rằng mọi thứ đều diễn ra tốt đẹp.

Vấn đề:

Nếu một tên miền có 1000 danh mục, mỗi loại có 20 trang, thì điều này dẫn đến 20000 URL được lập chỉ mục, thay vì 1000 nếu chúng ta sử dụng các phương thức cũ. Ngày xưa điều này được coi là xấu.

Có một sự đồng thuận về cách làm điều đó ngày nay? Bởi vì tôi đã thấy các lĩnh vực hoạt động rất tốt không thích ứng với những phát triển mới này và tuân theo những cách cũ.


4
rel=prev/nextvẫn hữu ích cho khả năng truy cập và điều hướng trình duyệt
Bergi

Câu trả lời:


7

Tôi sẽ xem xét loại bỏ phân trang hoàn toàn:

  • Nó không tốt cho các công cụ tìm kiếm.
    • Nó không vượt qua nước trái cây liên kết ngoài trang 2.
    • Nó tạo ra vô số trang chất lượng thấp bổ sung.
  • Nó không tốt cho người dùng.
    • Chỉ một tỷ lệ nhỏ người dùng (dưới 5%) từng sử dụng phân trang
    • Trong số những người dùng sử dụng phân trang, không ai nhận được nhiều hơn một vài trang trong

Có nhiều cách tốt hơn để xử lý danh mục sản phẩm lớn cho cả công cụ tìm kiếm và cho người dùng. Phân trang không cần thiết trên một trang web hiện đại.

Bạn nên làm gì thay vì phân trang?

  1. Có nhiều sản phẩm trên trang 1 hơn người dùng có thể cần. Tôi đề nghị liệt kê 100 sản phẩm trên trang chuyên mục.
  2. Thực hiện cuộn vô hạn. Cuộn vô hạn dễ dàng hơn cho người dùng so với phân trang. Hãy chắc chắn cung cấp một số lượng lớn các sản phẩm có thể nhìn thấy trước khi cuộn. Googlebot không bao giờ cuộn. Đó là một lỗi phổ biến khi triển khai cuộn vô hạn theo cách mà Googlebot nhìn thấy các trang hoặc trang trống chỉ với một vài liên kết nằm trên màn hình đầu tiên.
  3. Cung cấp tìm kiếm trang web. Người dùng thích tìm kiếm hơn là duyệt qua danh sách vô tận.
  4. Thực hiện điều hướng mặt. Người dùng muốn có thể truy sâu vào các sản phẩm theo các thuộc tính như "dưới 100 đô la", "với tính năng X" hoặc "4+ sao". Bạn có thể cho phép các công cụ tìm kiếm thu thập dữ liệu các trang khía cạnh có chính xác một thuộc tính được chọn.
  5. Tìm cách khác để liên kết đến từng trang sản phẩm. Sẽ tốt hơn nhiều cho các công cụ tìm kiếm nếu các trang sản phẩm liên kết với nhau. Nhiều trang web sử dụng các sản phẩm "sản phẩm liên quan", "khách hàng đã mua sản phẩm này cũng đã mua" và "sản phẩm đặc trưng" trên các trang sản phẩm để làm nổi bật các sản phẩm khác. Điều này có thể hữu ích cho người dùng, nhưng nó thường chủ yếu cho các công cụ tìm kiếm. Đó là lý do tại sao trang web này có phần câu hỏi "Liên quan" ở bên trái.

Nếu bạn thực hiện phân trang (và bạn có thể sẽ làm vì nó rất dễ lập trình) tôi sẽ đề nghị:

  • Lựa chọn đầu tiên: Ngăn chặn robot thậm chí thu thập dữ liệu trang 2+ bằng cách liệt kê chúng trong tệp robots.txt. Điều này có thể có nghĩa là sử dụng tiền tố riêng cho các trang 2+, chẳng hạn như bắt đầu các URL /pages/đó để bạn có thể sử dụng Disallow: /pages. Phân trang không vượt qua được nước ép liên kết một cách hiệu quả, vì vậy nó sẽ không ảnh hưởng đến thứ hạng của các trang sản phẩm để làm điều này. Nó sẽ ngăn chặn các trang sản phẩm sâu mới được phát hiện. Vì vậy, bạn hoàn toàn cần các liên kết khác vào mỗi trang sản phẩm từ các trang sản phẩm khác trước khi bạn làm điều này.
  • Lựa chọn thứ hai: Sử dụng noindextrên trang 2+ để ngăn công cụ tìm kiếm lập chỉ mục các trang chất lượng thấp. Nếu bạn không thể ngăn các trang được thu thập thông tin, ít nhất là ngăn không cho chúng được lập chỉ mục.
  • Lựa chọn thứ ba: Cho phép các công cụ tìm kiếm thu thập dữ liệu và lập chỉ mục tất cả các trang. Nếu bạn không triển khai các liên kết khác đến mọi trang sản phẩm, tôi sẽ đi với liên kết này. Nó sẽ không thực sự làm tổn thương SEO của bạn nhiều như vậy. Nó sẽ cho phép các công cụ tìm kiếm khám phá tất cả nội dung của bạn. Google có thể sẽ nhận thấy rằng các trang phân trang có chất lượng thấp và chọn không lập chỉ mục cho chúng. Mặc dù các công cụ tìm kiếm sẽ khám phá tất cả các trang sản phẩm của bạn, nhưng hầu hết trong số chúng sẽ không có đủ liên kết để được lập chỉ mục thông qua phân trang. Hy vọng chủ yếu chỉ những người được liệt kê trên trang 1 và 2 để được lập chỉ mục. Trong số những trang nằm ngoài trang 1, chúng sẽ không được xếp hạng tốt ngay cả khi chúng được lập chỉ mục cho đến khi bạn tìm cách đưa các liên kết khác từ trang web của bạn đến các trang đó.

Như bạn đã lưu ý, rel=prev/nextkhông được Google sử dụng. Bạn có thể sử dụng nó nếu bạn muốn, nhưng nó sẽ không thay đổi bất cứ điều gì.

rel=noindex,followkết thúc giống nhau và rel=noindex,nofollowđối với Google vì Google không chuyển nước trái cây liên kết qua các trang không có trong chỉ mục của nó. Như tôi đã lưu ý, dù sao nó cũng không thực sự quan trọng. Trang 3 hầu như không có liên kết nước trái cây có sẵn để vượt qua.

rel=canonicalđến trang đầu tiên sẽ không hoạt động nữa. Ngày nay, Google đang bỏ qua tín hiệu chính tắc nếu nội dung dường như không bị trùng lặp. Vì các sản phẩm được liệt kê là khác nhau, Google có thể bỏ qua mọi tín hiệu chính giữa các trang được phân trang.

Thêm về phân trang và PageRank

Google Pagerank (PR) từng được đo bằng Thanh công cụ Google theo thang logarit từ 0 đến 10. Nói chung, tôi sẽ nói rằng bạn cần Thanh công cụ PageRank (tPR) là 1 để được lập chỉ mục và 2 để xếp hạng cho các điều khoản đuôi cạnh tranh. Để làm cho việc tính toán PR dễ dàng hơn, tôi thường làm việc trong các đơn vị Juice Link Juice (LLJ).

  • 0 tPR = 1 LLJ
  • 1 tPR = 10 LLJ
  • 2 tPR = 100 LLJ
  • 3 tPR = 1.000 LLJ
  • 4 tPR = 10.000 LLJ
  • ...

Khi tôi nói rằng phân trang không vượt qua PageRank ngoài trang 2, tôi giả sử rằng mỗi trang trong phân trang chỉ liên kết đến trang tiếp theo. Trong trường hợp đó rất dễ dàng để xem những gì xảy ra. Giả sử rằng trang danh mục trang 1 của bạn có tPR là 3. Nó sẽ có 1.000 đơn vị LLJ, trong đó 900 đơn vị có sẵn để vượt qua (do hệ số giảm xóc của PageRank). Trong trường hợp có chính xác 21 liên kết trên trang 1 của bạn (20 đến các sản phẩm và một đến trang 2) thì mỗi trang khác có LLJ là 43 hoặc tPR là 1.6. Đủ để có được chỉ số và xếp hạng tốt.

Trang 2 có 43 LLJ để vượt qua. Mỗi trang nó liên kết đến chỉ được 1,8 LLJ hoặc 0,3 tPR. Có lẽ không đủ để có được các trang sản phẩm được lập chỉ mục. Chắc chắn không đủ PageRank cho trang 3 để vượt qua mọi thứ có ý nghĩa.

Khi bạn giới thiệu 10 liên kết phân trang trên mỗi trang, nó làm cho việc tính toán khó khăn hơn nhiều vì có các vòng phản hồi trong tính toán. Bạn phải xây dựng một biểu đồ liên kết và tính toán lưu lượng trên nhiều lần lặp thông qua nó. Bạn kết thúc trong một tình huống tương tự. Bạn có 20 sản phẩm nhận được một lượng PageRank kha khá từ trang 1. Các trang chiếu từ 2 đến 11 có số lượng PageRank tương tự và bạn có thể có được 200 sản phẩm mà chúng liên kết để lập chỉ mục. Ngoài trang 10, nó tương tự như trang 3 trong mô hình liên kết đơn.

Cuối cùng, tính toán PR chủ yếu là một bài tập học thuật. Các yếu tố khác như những gì Google xác định là chất lượng thấp cuối cùng đóng vai trò lớn. Google có thể sẽ chọn không lập chỉ mục các trang được phân trang của bạn vì chúng không tạo ra các trang đích tốt. Theo kinh nghiệm của tôi, có vẻ như Google đối xử với các trang không được lập chỉ mục giống như khi chúng có noindexthẻ meta. Nói cách khác, ngay cả khi bạn có thể PR cho họ, điều đó không thành vấn đề nếu Google không muốn lập chỉ mục cho họ. Nó sẽ không kết thúc thông qua PageRank thông qua họ.


Tuyệt thật, cảm ơn nhé. Nhưng làm thế nào để bạn nhận được tuyên bố "Nó không vượt qua nước trái cây liên kết ngoài trang 2"? Google vẫn sử dụng thuật toán PageRank, phải không? Vì vậy, nếu một trang danh mục liên kết đến 10 trang phụ để phân trang, thì tất cả 10 trang sẽ nhận được cùng một lượng nước ép liên kết. Hay kiến ​​thức của tôi về điều này cũng đã lỗi thời?
rapstacke

Đó là một điểm tốt. Giả định của tôi là phân trang chỉ liên kết đến trang tiếp theo. Liên kết đến 10 trang phân trang có thể nhận được một lượng nhỏ PR sâu hơn vào danh sách các trang sản phẩm của bạn. Tôi đã thêm nhiều hơn vào câu trả lời của tôi về điều đó.
Stephen Ostermiller

Câu trả lời sử thi, khiến tôi suy nghĩ lại về toàn bộ cách tiếp cận phân trang của mình. Tôi miễn cưỡng đồng ý với "Tôi sẽ xem xét loại bỏ hoàn toàn phân trang: Nó không tốt cho các công cụ tìm kiếm", đặc biệt là trong trường hợp phân trang của tôi sẽ làm tăng kho lưu trữ URL của tôi, do tìm kiếm toàn văn bản và các danh mục phụ được tạo tự động. Tôi cần phải viết một bộ phân tích để ước tính phạm vi của các loại con. Thực hiện phân trang có lẽ sẽ là một sai lầm. Cảm ơn một lần nữa, đã giúp tôi rất nhiều. Về phân phối PageRank: Có các công cụ như Audisto và có lẽ DeepCrawl cũng có thể trợ giúp.
rapstacke

2

Tôi thứ hai những gì @Stephen Ostermiller nói nhưng tôi không may phải không đồng ý về đề xuất của ông về việc thực hiện cuộn Infinite.

Cuộn vô hạn và tải thêm

Theo John mueller, Googlebot mở rộng chiều cao khung nhìn để mô phỏng kết xuất của trang như thể nó sẽ được hiển thị trên màn hình cực dài. Nếu trang của bạn với cuộn vô hạn lớn hơn chế độ xem, tất cả các liên kết vượt quá giới hạn của googlebot sẽ không bao giờ được thu thập thông tin. Nói cách khác, googlebot xem trang với cuộn vô hạn là một trang dài. Bạn cũng có thể tạo một trang dài để chắc chắn rằng googlebot thu thập nó.

Trên hết, John Mueller đã đề cập rằng Googlebot không "nhấp" vào các nút "tải thêm" Javascript.

Tham khảo - Hangout quản trị trang web của Google với John Mueller: https://youtu.be/WAagTHeF9N0?t=1320

Trang ít phân trang

Do đó, tôi nghĩ rằng cách duy nhất để vượt qua điều này là tạo các trang được phân trang với càng nhiều nội dung càng tốt để giảm số lượng trang được phân trang. Chẳng hạn, tôi đã tăng số lượng bài đăng tôi đã xuất bản trên các trang chuyên mục của mình từ 15 lên 60. Mục tiêu của tôi là có được một trang có kích thước tệp được chuyển 1mb. Để làm như vậy, tôi đã tối ưu hóa các tệp Jpg của mình. Chủ đề wordpress của tôi thực sự đáp ứng và hiển thị hình ảnh nhỏ trên điện thoại di động. Đó là lý do tại sao điều quan trọng là sử dụng một công cụ nén hình ảnh như https://squoosh.app/ (Squoosh là một công cụ nén trực tuyến miễn phí được duy trì bởi các phòng thí nghiệm của Google Chrome.)

Do đó, Googlebot chỉ có ba trang để thu thập thông tin để xem tất cả các liên kết. Tôi có thể đã xóa các hình ảnh trên trang danh mục để tôi có thể thêm nhiều liên kết hơn trên trang danh mục này.

Vì vậy, nếu bạn có 10 trang được phân trang với 10 liên kết mỗi trang, nếu bạn tăng số lượng liên kết lên 50, điều đó có nghĩa là nó sẽ chỉ tạo ra 2 trang được phân trang. Bạn sẽ lưu được 8 trang phân trang. Đó là một lợi ích rất lớn về ngân sách thu thập dữ liệu. Điều này cũng có nghĩa là mỗi khi bạn thêm một bài viết vào danh mục, sẽ mất thời gian trước khi một liên kết mới đến cuối trang và đi đến trang thứ hai.

Quan sát của tôi:

Tôi đã xem xét nhật ký truy cập của tôi nhiều lần. Tôi có một trang web được cung cấp bởi Wordpress có các trang danh mục được phân trang. Thông thường, nó thường thu thập dữ liệu trang đầu tiên của trang danh mục, sau đó nó hiếm khi thu thập dữ liệu trang thứ hai và thậm chí còn thu thập dữ liệu hiếm hơn trang thứ ba. Trong trường hợp của tôi, trang thứ ba được thu thập chính xác cứ sau 2 tháng. Vì vậy, bạn càng có nhiều trang được phân trang và Google càng ít có khả năng thu thập dữ liệu các trang tiếp theo.

Ở mức độ này, Google đối xử với trang được phân trang rất giống với các trang thông thường khi chúng được chôn sâu bên trong cấu trúc trang web.

Tôi đã thêm và xóa thẻ (trước / tiếp theo) nhiều lần và tôi không thấy bất kỳ thay đổi nào trên google hoặc Bing.

Ngoài ra, tôi đã tìm thấy bức ảnh này của một cuộc hội thảo với John Mueller. Có một slide có tiêu đề phân trang mà không có rel / tiếp theo. Và nó nhắc tôi những gì John Mueller nói.

  • Liên kết tự nhiên giữa các trang (được cấp. Mọi người làm điều đó)
  • Sử dụng URL sạch (Google khuyên tránh /? = Tham số hoặc 1 tham số)
  • Nội dung được phân loại so với các liên kết chi tiết: J. Mueller đề xuất với các trang được phân trang noindex nếu các liên kết trong các trang đó có thể được tìm thấy ở một nơi khác.

Hội thảo với John Mueller

Google muốn giết thứ hạng của những trang được phân trang mà bạn có thể thấy trên các trang web clickbait trong quảng cáo ở cuối một số trang web.

Ví dụ: "10 người đàn ông giàu nhất thế giới". Quản trị trang web chia trang thành 10 phần buộc người đọc nhấp vào "tiếp theo" để khám phá mọi người đàn ông giàu có. Họ làm như vậy để buộc độc giả xem mọi quảng cáo. Tuy nhiên, trang này sẽ không bao giờ được xếp hạng tốt trong Google vì các trang được phân trang tiếp theo sẽ nhận được (gần như) không có nước ép google.


1
Bạn đúng là Googlebot không cuộn trang và tải thêm thông tin vào đó. Nếu bạn triển khai cuộn vô hạn, bạn nên đảm bảo rằng một số lượng lớn sản phẩm xuất hiện trước khi cuộn (thậm chí 100) và đảm bảo rằng bạn có nhiều liên kết vào mỗi trang của mình, chẳng hạn như từ các trang sản phẩm và điều hướng khác nhau liên kết với nhau.
Stephen Ostermiller

Tăng số lượng mục trên mỗi trang có thể là một động thái tốt, nhưng ngay cả khi chỉ có ba trang, các bài đăng cũ của bạn sẽ không nhận được nhiều tình yêu (liên kết nước trái cây) thông qua phân trang. Với WordPress, tốt hơn là có một vài thẻ hoặc danh mục cung cấp điều hướng đến bài đăng của bạn. Thẻ và danh mục là phiên bản điều hướng theo khía cạnh của WordPress. Bạn chỉ cần cẩn thận để không có quá nhiều thẻ, đặc biệt là các thẻ chỉ có một vài bài viết được gắn thẻ. Việc sử dụng quá nhiều thẻ có thể tạo ra các trang trùng lặp và mỏng có thể dẫn đến các vấn đề về xếp hạng.
Stephen Ostermiller
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.