Tôi có một trang web di sản khá lớn với hàng ngàn tệp PDF đôi khi chiếm trong cơ sở dữ liệu, nhưng thường chỉ là các liên kết trên trang và được lưu trữ trong hầu hết mọi thư mục trên trang.
Tôi đã viết một trình thu thập dữ liệu php để theo dõi tất cả các liên kết trên trang web của mình, và sau đó tôi đang so sánh nó với một kết cấu của thư mục, nhưng có điều gì dễ dàng hơn không?