Đây là một câu trả lời muộn, nhưng để hoàn thiện: rất khó để đạt được gần 90% việc tìm nạp tất cả các biểu tượng yêu thích.
Một thời gian trước, tôi đã viết một plugin WordPress: http://wordpress.org/extend/plugins/wp-favicons/ để cố gắng tiếp cận gần hơn.
a. nó bắt đầu bằng cách xem các kho lưu trữ favicon như google favicons, getfavicons, v.v.
b. nếu không ai trong số họ trả lại biểu tượng (tôi kiểm tra điều này bằng cách khớp với biểu tượng mặc định mà họ trả về), tôi bắt đầu bằng cách cố gắng tự lấy biểu tượng
c. điều này liên quan đến việc duyệt qua các trang nhưng cũng kiểm tra các chuyển hướng KHÔNG tự động sửa lỗi cũng như duyệt qua 404 vì cũng có thể có biểu tượng trên 404. Cuối cùng, điều đó có nghĩa là bạn sẽ phải phân tích cú pháp cũng như chuyển hướng trong tiêu đề html cũng như chuyển hướng javascript để tiến gần hơn đến 100%
d. sau đó tôi thực hiện một số kiểm tra đối với tệp hình ảnh vật lý, vì đôi khi trên một số máy chủ (tôi đã thử nghiệm hơn 300.000) tệp bị trả về với loại mime không chính xác, v.v.
Mã vẫn chưa hoàn hảo bởi vì trong chi tiết nó trở nên điên rồ, bạn sẽ thấy nhiều tình huống kỳ lạ: mọi người đã mã hóa sai đường dẫn (img / favicon.ico trong đó img KHÔNG có trong thư mục gốc), trùng lặp tiêu đề trong đầu ra html, phản hồi máy chủ khác nhau từ đầu và cơ thể, v.v.
cốt lõi của phần tìm nạp là ở đây: http://plugins.svn.wordpress.org/wp-favicons/trunk/includes/server/class-http.php để bạn có thể thiết kế ngược lại nhưng lưu ý rằng việc xác thực phản hồi phải thực sự được thực hiện (kiểm tra loại tệp hình ảnh, mime, v.v.)