Một thiếu sót lớn curl
là ngày càng có nhiều wepage có phần nội dung chính được vẽ bởi phản hồi AJAX JavaScript xảy ra sau phản hồi HTTP ban đầu. curl
không bao giờ chọn lên nội dung sau khi vẽ này.
Vì vậy, để tìm nạp các loại trang web này từ dòng lệnh, tôi đã rút gọn việc viết các tập lệnh trong Ruby, điều khiển SeleniumRC để khởi động một phiên bản Firefox và sau đó trả về HTML nguồn sau khi các cuộc gọi AJAX này hoàn thành.
Sẽ tốt hơn nhiều nếu có một giải pháp dòng lệnh gọn hơn cho loại vấn đề này. Có ai biết về bất kỳ?