Câu trả lời:
Bạn có thể sử dụng wget
lệnh để tải trang xuống và đọc nó thành một biến dưới dạng:
content=$(wget google.com -q -O -)
echo $content
Chúng tôi sử dụng -O
tùy chọn wget
cho phép chúng tôi chỉ định tên của tệp để wget
lưu nội dung trang vào đó . Chúng tôi chỉ định -
đưa kết xuất vào đầu ra tiêu chuẩn và thu thập dữ liệu đó vào biến content
. Bạn có thể thêm -q
tùy chọn yên tĩnh để tắt đầu ra tiện ích.
Bạn cũng có thể sử dụng lệnh curl cho việc này như:
content=$(curl -L google.com)
echo $content
Chúng tôi cần sử dụng -L
tùy chọn vì trang chúng tôi yêu cầu có thể đã di chuyển. Trong trường hợp đó, chúng tôi cần lấy trang từ vị trí mới. Các -L
hoặc --location
tùy chọn giúp chúng ta với điều này.
src
thuộc tính của phần tử đúng, sau đó tải rằng trang. Nếu bạn cài đặt TQ , lệnh này nên làm điều đó:curl -s http://ww1.watchop.io/manga2/read/one-piece/1/4 | tq -j -a src "#imgholder a img" | xargs wget
convert_links = on
với -O-
tùy chọn. Nó không thành công với lỗi -k can be used together with -O only if outputting to a regular file.
. Nó có được mong đợi không?
Có nhiều cách để lấy một trang từ dòng lệnh ... nhưng nó cũng tùy thuộc vào việc bạn muốn nguồn mã hay chính trang đó:
Nếu bạn cần mã nguồn:
với cuộn:
curl $url
với wget:
wget -O - $url
nhưng nếu bạn muốn nhận được những gì bạn có thể thấy bằng trình duyệt, lynx có thể hữu ích:
lynx -dump $url
Tôi nghĩ rằng bạn có thể tìm thấy rất nhiều giải pháp cho vấn đề nhỏ này, có lẽ bạn nên đọc tất cả các trang hướng dẫn cho các lệnh đó. Và đừng quên thay thế $url
bằng URL của bạn :)
Chúc may mắn :)
Có wget
lệnh hoặc curl
.
Bây giờ bạn có thể sử dụng tệp bạn đã tải xuống với wget. Hoặc bạn có thể xử lý một con suối bằng cách uốn tóc.
Tài nguyên :
Nếu bạn đã cài đặt LWP , nó cung cấp một tệp nhị phân có tên đơn giản là " GET ".
$ NHẬN http://example.com <! DOCTYPE HTML PUBLIC "- // W3C // DTD HTML 4.01 Chuyển tiếp // EN"> <HTML> <HẾT> <META http-equiv = "Content-Type" content = "text / html; charset = utf-8"> <TITLE> Trang web mẫu </TITLE> </HEAD> <body> <p> Bạn đã truy cập trang web này bằng cách nhập & quot; example.com & quot ;, & quot; example.net & quot ;, & quot; example.org & quot hoặc & quot; example.edu & quot; vào trình duyệt web của bạn. </p> <p> Những tên miền này được dành riêng để sử dụng trong tài liệu và không có sẵn để đăng ký. Xem <a href="http://www.rfc-editor.org/rfc/rfc2606.txt"> RFC 2606 </a>, Phần 3. </p> </BODY> </HTML>
wget -O-
, curl
và lynx -source
hành xử tương tự.
Bạn có thể sử dụng curl
hoặc wget
để lấy dữ liệu thô, hoặc bạn có thể sử dụng w3m -dump
để trình bày văn bản đẹp của một trang web.
$ foo=$(w3m -dump http://www.example.com/); echo $foo
You have reached this web page by typing "example.com", "example.net","example.org" or "example.edu" into your web browser. These domain names are reserved for use in documentation and are not available for registration. See RFC 2606, Section 3.