Vì vậy, tôi có bãi chứa wikipedia này có kích thước khoảng 10gb và được đặt tên là "enwiki-mới nhất-Pages-article.xml.bz2". Tôi đã thử các lệnh sau trong terminal để giải nén kết xuất:
tar jxf enwiki-latest-pages-articles.xml.bz2
Và
tar xvf enwiki-latest-pages-articles.xml.bz2
Nhưng cả hai đều trả về lỗi sau
tar: This does not look like a tar archive
tar: Skipping to next header
1
arun chạy lệnh sau và vượt ra ngoài "tập tin enwiki-mới nhất-Pages-
—
article.xml.bz2
Tôi nhận thấy bạn nói rằng đây là một tập tin khổng lồ - vì vậy một điều khác mà bạn có thể muốn làm là đưa nó vào một cái gì đó, bzcat enwiki-mới nhất-Pages-article.xml.bz2 | một số chương trình khác
—
nwaltham
@nwaltham: Bạn sẽ có upvote của tôi nếu bạn đưa ra câu trả lời.
—
Ilmari Karonen
Bởi vì tar trích xuất các tập tin tar, và nó không phải là một tập tin tar?
—
dùng253751