Sử dụng trình duyệt web (IE hoặc Chrome) Tôi có thể lưu một trang web (.html) bằng Ctl-S, kiểm tra nó với bất kỳ trình soạn thảo văn bản nào và xem dữ liệu ở định dạng bảng. Một trong những số tôi muốn trích xuất, nhưng đối với nhiều, nhiều trang web, quá nhiều để làm thủ công. Vì vậy, tôi muốn sử dụng WGET để lần lượt lấy các trang web đó và viết một chương trình khác để phân tích cú pháp .html và lấy số tôi muốn. Nhưng tệp .html được lưu bởi WGET khi sử dụng cùng một URL vì trình duyệt không chứa bảng dữ liệu. Tại sao không? Như thể máy chủ phát hiện yêu cầu đến từ WGET chứ không phải từ trình duyệt web và cung cấp trang web bộ xương, thiếu bảng dữ liệu. Làm cách nào tôi có thể có cùng một trang web với WGET? - Cám ơn!
THÊM THÔNG TIN:
Một ví dụ về URL tôi đang cố gắng tìm nạp là: http://performance.morningstar.com/fund/performance-return.action?t=ICENX®ion=usa&cocate=en-US trong đó chuỗi ICENX là biểu tượng đánh dấu quỹ tương hỗ , mà tôi sẽ thay đổi thành bất kỳ biểu tượng đánh dấu nào khác nhau. Điều này tải xuống một bảng dữ liệu khi được xem trong trình duyệt, nhưng bảng dữ liệu bị thiếu nếu được tìm nạp bằng WGET.