wget --content-disposition 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
Tệp bạn đang tải xuống là tar
tệp lưu trữ (tệp nhị phân), được cung cấp bởi liên kết động từ máy chủ web. wget
thông thường sẽ lưu tệp bằng một phần URL mà bạn đang sử dụng, nhưng trong trường hợp này chỉ là điểm cuối API REST (hoặc một cái gì đó tương tự) để tên đó không thân thiện để làm việc (nó vẫn là tên hợp lệ và nội dung tập tin sẽ giống nhau).
Tuy nhiên, trong trường hợp này, máy chủ cung cấp tiêu đề "Bố trí nội dung" chứa tên tệp thực tế, wget
có thể sử dụng nếu bạn sử dụng --content-disposition
tùy chọn. Tùy chọn này được đánh dấu "thử nghiệm" trong hướng dẫn của tôi cho wget
.
Bạn cũng cần trích dẫn URL để shell không diễn giải các ký tự &
và ?
ký tự trong đó.
Điều tương đương bằng cách sử dụng curl
:
curl -J -O 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
Hoặc, sử dụng các tùy chọn dài tương đương:
curl --remote-header-name --remote-name 'https://www.ncbi.nlm.nih.gov/geo/download/?acc=GSE48191&format=file'
Khi bạn đã tải xuống tệp, bạn cần giải nén nó:
tar -xvf GSE48191_RAW.tar
Do cách lưu trữ cụ thể này được tạo, điều này sẽ giải nén các tệp của kho lưu trữ vào thư mục hiện tại (vì vậy việc tạo một thư mục mới, di chuyển kho lưu trữ ở đó và giải nén nó có thể là một ý tưởng hay). Các tập tin trong kho lưu trữ này là các tập tin gzip
nén CEL
.