Do công cụ tìm kiếm trực tiếp phạt ngữ pháp xấu?


14

Giả sử tôi có một trang web có nội dung do người dùng đóng góp, có nội dung tốt nhưng ngữ pháp xấu, thuật ngữ tiếng lóng và âm điệu không phù hợp.

Tôi biết rằng ngữ pháp xấu cũng là một vấn đề, bởi vì nó làm mất khách truy cập và khiến mọi người sợ liên kết với nó, nhưng hãy để nó qua một bên.
Chúng ta cũng tạm gác lại một thực tế là các thuật ngữ chính tả có thể bị bỏ qua bởi trình thu thập thông tin, có khả năng dẫn đến các lần truy cập so sánh văn bản ít hơn.

Các công cụ tìm kiếm như Google trực tiếp nhận ra và xử phạt ngữ pháp xấu?
Chẳng hạn, vì họ có thể coi ngữ pháp xấu là dấu hiệu của nội dung chất lượng thấp.

Câu trả lời:


14

Matt Cutts của Google đã được hỏi câu hỏi này và trả lời trực tiếp trong một video (tháng 8 năm 2011):

Chính tả và vấn đề ngữ pháp khi đánh giá nội dung và chất lượng trang web?

Ít nhất là lần cuối cùng tôi kiểm tra (cách đây một thời gian), nó không được sử dụng làm tín hiệu trực tiếp trong bảng xếp hạng của chúng tôi . Vì vậy, đây không phải là một trong 200 tín hiệu khác nhau mà chúng tôi sử dụng để đánh giá chất lượng của một trang.

Nhưng tôi nghĩ sẽ công bằng khi nghĩ về việc sử dụng nó như một tín hiệu. Trước đây, chúng tôi đã nhận thấy rằng, nếu bạn nhìn vào PageRank của một trang - chúng tôi nghĩ rằng một trang hoặc trang web cụ thể có uy tín như thế nào - khả năng đánh vần tương quan tốt với điều đó. Vì vậy, các trang web có uy tín có xu hướng đánh vần tốt hơn và các trang web có PageRank thấp hơn hoặc PageRank rất thấp, có xu hướng không đánh vần tốt, đó là một hiệu ứng khá thú vị nếu bạn nghĩ về nó.

Vì vậy, ví dụ, lấy chính tả và ngữ pháp. Có một giả định cố hữu trong câu hỏi đó là bạn đang nói về chính tả và ngữ pháp của một ngôn ngữ cụ thể. Và để tìm ra cách đánh vần và ngữ pháp như thế nào, bạn phải tìm ra ngôn ngữ của trang đó là gì. Và ngay cả khi bạn có nhận dạng ngôn ngữ tốt nhất trên thế giới, qua hàng chục tỷ tài liệu, bạn sẽ thấy rằng có thể có một vài trang mà bạn đã bỏ lỡ.

Và vì vậy bạn có thể nghĩ rằng trang này có lỗi chính tả hoặc ngữ pháp khủng khiếp, nhưng hóa ra nó thực sự chỉ bằng tiếng Hungary thay vì bằng tiếng Anh. Hoặc có thể một hoặc hai đoạn bằng tiếng Hungary, thay vì tiếng Anh. Và đó không phải là trường hợp mà bạn có thể tự động nói, aha, đây sẽ là một tín hiệu hoàn hảo. Đó là lý do tại sao chúng tôi cố gắng đánh giá rất nhiều. Chúng tôi thực hiện rất nhiều thử nghiệm để xem liệu thứ gì đó có thực sự là một chiến thắng chất lượng hay không, liệu nó có phù hợp với trực giác của chúng tôi hay không. Nhưng đó là loại điều mà theo kinh nghiệm của chúng tôi, các trang có uy tín hơn thường có xu hướng chính tả tốt hơn và ngữ pháp tốt hơn. Và vì vậy, nếu bạn có thể dành thời gian để đảm bảo rằng một cái gì đó được chỉnh sửa tốt, bạn sẽ thấy nó có lẽ không chỉ là một phần nội dung tổng thể tốt mà có khả năng đứng trước thử thách của thời gian, nhưng có lẽ người dùng sẽ đánh giá cao nó. Mọi người có thể hiểu khi họ truy cập vào một trang cho dù một cái gì đó bị loại ra một cách nhanh chóng so với ai đó đặt rất nhiều công việc vào đó. Có một biên tập viên sao chép hoặc ai đó đã kiểm tra thực tế hoặc họ là một chuyên gia về chủ đề này.

Và vì vậy, khi có thể, tôi chắc chắn cố gắng chú ý đến chính tả và ngữ pháp, ngay cả khi tôi tweet. Đôi khi bạn gây rối, nhưng đó là điều mà tôi khuyến khích mọi người chú ý, có thể không nhất thiết phải trực tiếp cho bảng xếp hạng tìm kiếm, nhưng chỉ vì đó là trải nghiệm tốt cho người dùng và người dùng đánh giá cao điều đó. Họ sẽ có nhiều khả năng đánh dấu bạn hoặc quay lại hoặc nói với bạn bè của họ về bạn.

Bây giờ Duane Forrester của Bing nói rằng Bing đang tính đến chính tả và ngữ pháp trong bảng xếp hạng (tháng 2 năm 2014):

Chất lượng: Bạn có nó, hoặc chỉ nghĩ rằng bạn có nó?

...

Nếu bạn đấu tranh để vượt qua lỗi chính tả, tại sao một công cụ sẽ hiển thị một trang nội dung có lỗi cao hơn trong bảng xếp hạng khi các trang khác có nội dung không có lỗi tồn tại để phục vụ người tìm kiếm? Dù muốn hay không, chúng tôi được đánh giá bởi chất lượng của kết quả mà chúng tôi hiển thị. Vì vậy, chúng tôi liên tục xem chất lượng của nội dung chúng tôi thấy.


Tôi sẽ nói rằng đây là một câu trả lời tốt hơn nhiều, với lời cảnh báo: Nếu nó là nhỏ, nó không phải là một vấn đề; tuy nhiên, nếu trang web bị lỗi, điều đó có thể dẫn đến trải nghiệm người dùng kém và tỷ lệ thoát cao hơn sẽ trở thành tín hiệu gián tiếp cho Google rằng trang web có thể có chất lượng thấp và do đó xứng đáng được xếp hạng thấp hơn.
vẽ

5

Tôi nghĩ rằng nó có thể có thể. Google phát hiện ngữ pháp xấu, nhưng rất có thể họ sẽ không phạt trực tiếp ngữ pháp xấu. Lấy các trường hợp (hữu ích?) Sau đây cho ngữ pháp xấu:

  • Engrish nội dung hài hước và như vậy.
  • Một trang có "ví dụ" về ngữ pháp xấu với các sửa chữa bên dưới.
  • Một số ngữ pháp được coi là "xấu" cho các khu vực khác nhau ... Điều này có thể xảy ra với "tiếng Hà Lan" được sử dụng ở Hà Lan , Bỉ hoặc Nam Phi .
  • Một trang hiển thị các văn bản dễ thương nói hoặc viết bởi trẻ em.

Điểm tốt! Tôi đoán rằng Google sẽ khó phân biệt ngữ pháp xấu với việc sử dụng en.wikipedia.org/wiki/English-basing_creole_lacularen.wikipedia.org/wiki/Modern_English
Nicolas Raoul

Bỉ, người đàn ông, Bỉ! (ZB)
Peter Mortensen

2

Google sẽ không phạt trực tiếp một trang có chứa ngữ pháp xấu. Google xem xét tỷ lệ thoát của một trang vì vậy nếu bạn có nội dung trang web có ngữ pháp xấu và người dùng của bạn ghét những lỗi ngữ pháp đó và họ đã thoát ra khỏi trang của bạn, thì trang web của bạn sẽ có tác động tiêu cực đến Google. Google chỉ tính chất lượng nội dung (trùng lặp hoặc không) và không phải là lỗi ngữ pháp. Ngay cả nhiều trang diễn đàn có cả nội dung ngữ pháp tốt cũng như xấu, nhưng chúng ở vị trí hàng đầu trong trang kết quả của Google. Mong là bạn hiểu..

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.