Công cụ tốt để thu thập dữ liệu trang web của tôi và giúp tôi tìm liên kết chết và các tệp không được liên kết [đã đóng]

21

Đã đóng cửa. Câu hỏi này không đúng chủ đề . Nó hiện không chấp nhận câu trả lời.

Bạn muốn cải thiện câu hỏi này? Cập nhật câu hỏi để nó thuộc chủ đề cho Trao đổi ngăn xếp webmaster.

Đóng cửa 6 năm trước .

Tôi có một trang web di sản khá lớn với hàng ngàn tệp PDF đôi khi chiếm trong cơ sở dữ liệu, nhưng thường chỉ là các liên kết trên trang và được lưu trữ trong hầu hết mọi thư mục trên trang.

Tôi đã viết một trình thu thập dữ liệu php để theo dõi tất cả các liên kết trên trang web của mình, và sau đó tôi đang so sánh nó với một kết cấu của thư mục, nhưng có điều gì dễ dàng hơn không?

site-maintenance web-crawlers dead-links

— MrChrister
nguồn

Xem thêm webmasters.stackexchange.com/questions/13310/ Người cũng hỏi về kiểm tra chính tả.

— James Skemp

15

Tôi đã sử dụng Link Sleuth của Xenu . Nó hoạt động khá tốt, chỉ cần chắc chắn không để DOS tự!

— plntxt
nguồn

1

Kiểm tra tùy chọn 'tệp mồ côi' trong các tùy chọn và nó sẽ nhắc bạn đăng nhập ftp vào trang web của bạn.

— xương chậu

Điều này có xử lý các trang web bạn phải đăng nhập quá, để vào trang không?

— Donny V.

@Jim Làm thế nào tôi có thể xem trang nào bị hỏng liên kết?

— Cướp

Khi thu thập thông tin hoàn tất, có một báo cáo sẽ cho bạn biết thông tin. Tùy thuộc vào kích thước của trang web và số lượng liên kết bị hỏng, có thể khó phân tích. Tôi thường điều chỉnh các tùy chọn báo cáo trước khi thu thập thông tin và tôi mở báo cáo dưới dạng tệp văn bản (vì nó là .htm) và xóa nội dung không phù hợp để dễ quản lý hơn. Hi vọng điêu nay co ich.

— plntxt

6

Nếu bạn đang sử dụng windows 7, công cụ tốt nhất là Bộ công cụ SEO của IIS7. Nó là miễn phí và bạn có thể tải về miễn phí.

Công cụ sẽ quét bất kỳ trang web nào và cho bạn biết tất cả các liên kết chết ở đâu, trang nào mất nhiều thời gian để tải, trang nào thiếu tiêu đề, tiêu đề trùng lặp, giống nhau cho từ khóa và mô tả và trang nào bị hỏng HTML.

— Ben Hoffman
nguồn

1

Tôi đã sử dụng cái này một cách cá nhân, và nó rất tuyệt vời để quét và tất nhiên là SEO, nhưng việc kiểm tra FTP trong Xenu chỉ vượt qua điều này.

— MrChrister

4

Hãy dùng thử Công cụ kiểm tra liên kết công cụ nguồn mở của W3C . Bạn có thể sử dụng trực tuyến hoặc cài đặt cục bộ

— mvark
nguồn

1

Tôi là một fan hâm mộ lớn của linklint khi kiểm tra liên kết các trang web tĩnh lớn, nếu bạn có một dòng lệnh unix xung quanh (Tôi đã sử dụng trên linux, MacOS và FreeBSD). Xem trang web của họ để được hướng dẫn cài đặt. Sau khi cài đặt, tôi tạo một tệp có tên check.llvà làm:

linklint @check.ll

Đây là tập tin check.ll của tôi trông như thế nào

# linklint
-doc .
-delay 0
-http
-htmlonly
-limit 4000
-net
-host www.example.com
-timeout 10

Đó là thu thập dữ liệu www.example.comvà tạo các tệp HTML với các báo cáo được tham chiếu chéo cho những gì bị hỏng, thiếu, v.v.

— nghệ thuật
nguồn

1

Có một số sản phẩm từ microsys , đặc biệt là Trình tạo sơ đồ trang web A1 và Trình phân tích trang web A1 của họ sẽ thu thập dữ liệu trang web của bạn và báo cáo mọi thứ bạn có thể tưởng tượng về nó.

Điều đó bao gồm các liên kết bị hỏng, nhưng cũng là chế độ xem bảng của tất cả các trang của bạn để bạn có thể so sánh các thứ như thẻ <title> và thẻ mô tả meta, liên kết nofollow, meta noindex trên các trang web và rất nhiều bệnh chỉ cần một con mắt sắc bén và một tay nhanh chóng để sửa chữa.

— Evgeny
nguồn

1

Link Examiner là một phần mềm miễn phí thực sự tốt cho nhu cầu của bạn.

— Tối
nguồn