Ý nghĩa của lỗi Thu thập dữ liệu


7

Câu hỏi của tôi là về định nghĩa lỗi Thu thập dữ liệu trong Công cụ quản trị trang web của Google . Lỗi thu thập dữ liệu được chia thành một số phần.

Trước tiên hãy xem xét phần HTTP .

Tôi giả sử rằng tất cả các liên kết bị hỏng trong phần này được tìm thấy bằng cách nào đó bởi trình thu thập thông tin, đây không phải là các liên kết từ sơ đồ trang web. Nếu tất cả các liên kết này được tìm thấy bằng cách quét các trang từ sơ đồ trang web cho các liên kết, tại sao nó không đề cập đến trang nguồn là gì, như trong phần sơ đồ trang web với cột Được liên kết từ . Xin hãy sửa tôi nếu tôi sai.

Phần sơ đồ trang web .

Có vẻ như tất cả các liên kết đến từ sơ đồ trang web của tôi. Nhưng có cột Linked From , tôi đã biết rằng tất cả các liên kết bị hỏng đó là từ sơ đồ trang web, vì vậy để sửa lỗi, tôi nên sửa lại sơ đồ trang web của mình. Tôi có lầm không?

Không theo phần.

Tôi không biết nó có nghĩa gì. Có vẻ như nó tích lũy tất cả các liên kết gây ra chuyển hướng, nhưng vì một số lý do, Google coi tất cả các liên kết đó là chuyển hướng sai. Bạn có biết nếu có bất kỳ bộ quy tắc làm thế nào để xác định chuyển hướng sai. Trên thực tế tôi thấy đó là sai lầm của tôi, tôi đã cố gắng bình thường hóa URL và chuyển hướng nó đến đúng URL, nhưng tôi đã bình thường hóa một cách sai lầm.

Không tìm thấy phần.

Phần này giống như phần HTTP nhưng có lỗi 404. Phần này đã liên kết từ cột. Nhưng rất thường xuyên liên kết Từkhông có sẵn . Điều đó có nghĩa là gì, Google không thể cho tôi biết làm thế nào nó tìm thấy trang không tồn tại này. Làm thế nào phần này liên quan đến phần sơ đồ trang web. Phần này có chứa tất cả các liên kết 404 từ sơ đồ trang web không. Nhưng có quá nhiều liên kết 404, nhiều hơn so với trong sơ đồ trang web. Tôi đã cố gắng xem những gì chúng tôi có trong Linked From và tôi thấy rằng liên kết này đến từ sơ đồ trang web hai tháng trước. Nhưng tại sao Google giữ cho nó được lập chỉ mục, liên kết đã chết, sơ đồ trang web mới không có nó. Nếu có bất kỳ ngày hết hạn cho các liên kết cũ?

Phần không thể truy cập .

Hình như phần này cho 500 lỗi. Phần này không chứa Liên kết từ cột. Có quá nhiều liên kết hoàn toàn vô nghĩa, tôi thực sự không biết công cụ này đến từ đâu và không có Liên kết từ tôi không thể tìm ra cách đối phó với nó.

Xin lỗi vì một chủ đề lớn như vậy, nhưng tôi chỉ muốn làm cho nó rõ ràng, mọi phần đều đại diện cho điều gì, bởi vì nó cực kỳ quan trọng để giải quyết tất cả những vấn đề đó. Hy vọng nó sẽ hữu ích không chỉ cho tôi.

Cảm ơn!


1
Tôi đã xem tệp trợ giúp cho các báo cáo đó google.com/support/webmasters/bin/ , và nó trả lời hầu hết các câu hỏi của bạn. Những người không trả lời - có ngày hết hạn không? Tôi không nghĩ có ai biết được bao lâu trước khi Google từ bỏ các liên kết xấu. Trong thời gian chờ đợi, bạn có thể chuyển hướng cho các trang đó. Các liên kết vô nghĩa - chúng tôi không thể giúp mà không biết thêm thông tin.
paulmorriss

tôi có cùng một vấn đề 500 lỗi trên các liên kết không đến từ tôi và có các tham số không hợp lệ.

Câu trả lời:


3

Tôi nghĩ rằng bạn chủ yếu là đúng với các giả định của bạn.

Phần HTTP đầu tiên hiển thị tất cả các lỗi 4xx ngoài các lỗi 404 (phổ biến hơn nhiều vì vậy hãy lấy trang riêng của họ). Tôi nhận được 400 lỗi (yêu cầu xấu) từ CodeIgniter không cho phép một số ký tự nhất định trong URL. 403 (bị cấm) cũng ở đây.

Phần sơ đồ trang web chỉ cho bạn biết bất kỳ URL nào trong sơ đồ trang web không thể tìm thấy. Phần "được liên kết từ" rất hữu ích để nếu một trang không còn tồn tại, bạn có thể xóa liên kết đến nó.

Tôi chưa bao giờ thấy phần không được theo dõi nhưng có vẻ như nó liệt kê bất kỳ URL nào được liên kết với rel = ofollow.

Không tìm thấy là mỗi lỗi 404. Nó có thể sẽ liệt kê các trang trong sơ đồ trang web của bạn bởi vì rõ ràng những trang đó nên được liên kết đến trên trang web của bạn (nói cách khác, một trang chỉ trong sơ đồ trang web và không được liên kết ở bất kỳ đâu sẽ không xuất hiện ở đây).

Không thể truy cập là 5xx lỗi như bạn đã nói, đó là lỗi máy chủ. "Được liên kết từ" không được hiển thị ở đây vì điều đó không quan trọng, không có trang nào sẽ trả về lỗi 5xx.


Tôi đồng ý rằng các trang lý tưởng không nên trả về lỗi 5xx, nhưng đôi khi "được liên kết từ" hữu ích trong ngữ cảnh này (ít nhất là để xác định bạn sẽ làm gì với nó) - ví dụ: nếu bạn được gửi truy vấn không hợp lệ tham số từ hộp thả xuống, bạn có thể muốn xác nhận rằng những thứ này không đến từ trang web của bạn.
Zhaph - Ben Duguid

Không chắc chắn làm thế nào tôi có thể giải thích điều này tốt hơn, nhưng không có "lý tưởng", lỗi 5xx không bao giờ nên xảy ra. Đó là sự cố máy chủ, không liên quan gì đến việc ai liên kết với bạn hoặc họ gửi thông số gì.
DisgruntledGoat

Sau đó, tôi sẽ cố gắng giải thích rõ hơn: Lỗi 5xx có thể do lập trình kém: Nếu tôi chỉ mong đợi một bộ biến cố định được gửi từ trang của mình, tôi có thể (thật ngu ngốc) không bận tâm xử lý tình huống trong đó trang nhận các giá trị sai (tức là một giá trị không nằm trong danh sách thả xuống của tôi ). Nếu tôi biết rằng một số trang web ngẫu nhiên đang cố liên kết đến một trang mà không có giá trị chính xác thì tôi có thể thực hiện cuộc gọi về cách / cái gì cần sửa - và cách khắc phục đó có thể là trả về 404 hoặc 403 hoặc tôi có thể quyết định rằng tôi có những thứ ưu tiên cao hơn để sửa chữa và liên kết tinh ranh này có thể được bỏ qua ngay bây giờ.
Zhaph - Ben Duguid

Các tham số không chính xác sẽ tạo ra các lỗi PHP (nếu bạn đang sử dụng PHP) không phải là lỗi máy chủ. Thông thường trang vẫn trả về 200 (OK) trong các trường hợp đó AFAIK. Có lẽ các khung nhất định như .net xuất 500 lỗi nhưng chúng không thực sự.
DisgruntledGoat

Đúng, đó là .NET. Tôi đã nghĩ đến việc một ngoại lệ trong mã sẽ dẫn đến lỗi máy chủ nội bộ. Tôi sẽ không vui nếu điều đó dẫn đến "200 Thành công": "Mã trạng thái phản hồi bắt đầu bằng chữ số" 5 "cho biết các trường hợp máy chủ nhận thấy rằng nó đã gặp lỗi hoặc không thể thực hiện yêu cầu. . [T] máy chủ của anh ta phải bao gồm một [...] giải thích về tình huống lỗi [...]. Các tác nhân dịch vụ sẽ hiển thị bất kỳ thực thể nào được bao gồm cho người dùng. Các mã phản hồi này có thể áp dụng cho bất kỳ phương thức yêu cầu nào. " bit.ly/t9zYJb
Ben Duguid
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.