Bạn có thể lấy -pages-articles.xml.bz2
từ trang web Wikimedia và xử lý chúng bằng WikiTaxi (tải xuống ở góc trên bên trái). Công cụ nhập Wikitaxi sẽ tạo .taxi
tệp (khoảng 15Gb cho Wikipedia) ra khỏi .bz2
tệp. Tập tin đó sẽ được chương trình WikiTaxi sử dụng để tìm kiếm thông qua các bài viết. Trải nghiệm rất giống với trải nghiệm trình duyệt.
Hoặc bạn có thể sử dụng Kiwix , nhanh hơn để thiết lập vì nó cũng cung cấp các bãi chứa ( .zim
tệp) đã được xử lý . Vì nhận xét chỉ định để mwoffliner
có thể sử dụng các trang web MediaWiki khác cho kiwix , nó có thể không hoạt động với tất cả vì chúng có thể có sự khác biệt tùy chỉnh nhưng đó là biến thể duy nhất tôi gặp.
Sử dụng Wikimedia thứ wget
không phải là thực hành tốt. Nếu quá nhiều người sẽ làm điều đó có thể làm ngập các trang web với các yêu cầu.
Chỉnh sửa sau này cho trường hợp bạn cũng muốn hình ảnh ngoại tuyến:
Nếu bạn muốn một bản sao hoàn chỉnh của Wikipedia (bao gồm cả hình ảnh) định dạng HTML đầy đủ nguyên vẹn sẽ tải xuống trong aprox 30 giờ , bạn nên sử dụng:
Wikipedia tiếng Anh có rất nhiều dữ liệu. Có hơn 13,9 triệu trang với hơn 20,0 GB văn bản, cũng như hơn 3,7 triệu hình thu nhỏ.
XOWA :
Thiết lập tất cả điều này trên máy tính của bạn sẽ không phải là một quá trình nhanh chóng ... Bản thân việc nhập sẽ cần 80GB dung lượng ổ đĩa và thời gian xử lý năm giờ cho phiên bản văn bản. Nếu bạn cũng muốn hình ảnh, con số tăng lên 100GB dung lượng đĩa và thời gian xử lý 30 giờ. Tuy nhiên, khi bạn hoàn thành, bạn sẽ có một bản Wikipedia tiếng Anh hoàn chỉnh, gần đây với hình ảnh có thể vừa với thẻ SD 128GB.
Nhưng phiên bản ngoại tuyến rất giống với phiên bản trực tuyến, bao gồm ảnh, v.v .:
(Tôi đã kiểm tra bài viết dưới đây hoàn toàn ngoại tuyến)
Chỉnh sửa sau nếu không có điều nào ở trên áp dụng:
Nếu wiki không phải là một phần của Wikimedia hoặc không có kết xuất, có một dự án trên github tải wiki đó bằng API của nó:
Main Page
và theo các liên kết từ đó.