Cuối cùng tôi đã đi sâu vào thư mục con có vấn đề thông qua tìm kiếm trang web: domain.com/foo/bar/ nhưng trong tìm kiếm của tôi, tôi đã tìm thấy một phương pháp để đưa kết quả tìm kiếm vào một tệp excel.
Mở bảng tính Google Docs và sử dụng công thức này:
=importXml("www.google.com/search?q=site:domain.com&num=100&start=1"; "//cite")
Nó sẽ chỉ nhận được 100 kết quả đầu tiên nhưng bạn có thể sử dụng lại để nhận 100 kết quả tiếp theo. Chỉ cần thay đổi biến bắt đầu:
=importXml("www.google.com/search?q=site:domain.com&num=100&start=100"; "//cite")
Điều này sẽ chỉ cung cấp tối đa 1000 kết quả, như DisgruntledGoat đã đề cập trước đây, nhưng công thức có thể được thay đổi để cung cấp các liên kết từ các thư mục con cụ thể:
= importXml ("www.google.com.vn/search?q=site:domain.com/foo/bar/&num=100&start=1"; "// trích dẫn")