Chúng tôi đang gặp sự cố khi Google lập chỉ mục các tệp PDF trong trang web của chúng tôi. Có khoảng 50 PDF và phạm vi kích thước cho 20 KB đến một chút dưới hai megs. Chúng không được bảo vệ, có thể được đọc ẩn danh và bên trong PDF Reader, bạn có thể tìm kiếm tài liệu.
Chúng được liệt kê trong SiteMap.xml. Tôi thậm chí có thể nhìn vào nhật ký IIS và thấy Googlebot đang đọc các tệp PDF, nhưng, ngoại trừ năm, chúng không bao giờ được đưa vào kết quả tìm kiếm.
Nếu tôi làm một filetye: pdf, chỉ có năm tệp PDF xuất hiện. Nếu tôi tìm kiếm văn bản mà tôi biết là bên trong một tệp PDF, các tệp PDF không bao giờ hiển thị (ngoại trừ năm tệp được lập chỉ mục).
Có ai có ý tưởng tại sao hơn 45 tài liệu PDF không được đưa vào chỉ mục, mặc dù chúng nằm trong sơ đồ trang web và Googlebot đang đọc chúng không?