Đôi khi tôi sử dụng chế độ nhện tích hợp của wget để thuận tiện kiểm tra nhanh chóng một trang web địa phương để tìm các liên kết bị hỏng. Sáng nay tôi đã chú ý đến một trang web sản xuất mà chúng tôi vừa mới đưa ra những thay đổi lớn và nó xuất hiện với 3 liên kết bị hỏng, nhưng dường như không thể biết chúng ở đâu! (Nó chỉ nói những gì họ liên kết đến và không có cách liên quan đơn giản nào mà quay lại một trang.)
Các tùy chọn tôi hiện đang sử dụng là wget -r -nv --spider http://www.domain.com/ -o /path/to/log.txt
. Có ai biết về một tùy chọn mà tôi đang xem, một cách để đọc đầu ra hoặc thậm chí là một thay thế đơn giản cho lệnh này cũng sẽ cho tôi biết tập tin nào liên kết xuất hiện trong (và lý tưởng là một dòng #) không?