Câu trả lời:
Kiểm tra lessFS, hệ thống tập tin sao chép dữ liệu cho Linux. Nó vẫn đang trong giai đoạn thử nghiệm nhưng bạn có thể dùng thử:
Trân trọng,
MV
Sự trùng lặp đang đến với ZFS trên OpenSolaris nhưng chức năng đó hiện không có sẵn.
Nó được tạo ra bởi Jeff Bonwick và Bill Moore trong mùa đông vừa qua và họ đang nỗ lực tích hợp nó vào mùa hè này. Vì vậy, nó sẽ có sẵn trong phiên bản tiếp theo của OpenSolaris hoặc sớm hơn nếu bạn muốn chơi xung quanh với nhánh phát triển.
Đối với những người có thể không quen với việc sao chép dữ liệu, đó là một kỹ thuật trong đó dữ liệu được phân tích ở cấp độ tệp (hoặc khối, tôi cho là) và khi các tệp / khối giống hệt nhau trong hệ thống tệp được thay thế bằng mã thông báo nhỏ hơn. Điều này có tác dụng thu nhỏ đáng kể kích thước hiệu quả trên đĩa. Nó có thể được coi là một hình thức sao chép trên văn bản . Đọc trang wiki trên đó.
Không có hệ thống tập tin mà tôi đã nghe nói trong Linux để thực hiện khấu trừ, tập tin hoặc cấp độ khối. Một con thú như vậy sẽ có ích, mặc dù bộ xử lý khá chuyên sâu.
Một năm sau, nhưng đây là một giải pháp cho OpenBSD được gọi là Epitome: http://www.peereboom.us/epitome/ . Với điều kiện là cấp phép tự do, nó rất có thể biến nó thành nhân Linux.
Tôi vừa đăng một dự án mà tôi đang làm việc trên đó không trùng lặp nội tuyến. Bạn có thể xem nó ở đây nếu bạn bị chặn. Nó dựa trên cầu chì và chạy trên linux.
Tôi không biết về bất kỳ triển khai miễn phí nào cho Linux. Tôi đã thấy một số nhà cung cấp lưu trữ khuyên bạn nên sử dụng hệ thống HSM (quản lý lưu trữ phân cấp) với VTL (Thư viện lưu trữ ảo) có khả năng khấu trừ.
Bạn cũng có thể xem xét một hệ thống giống như Occarina không minh bạch nhưng có thể cung cấp kết quả tốt hơn so với khấu trừ.
vậy ... không có tin tức gì về sự trùng lặp trên Linux? opendsup có thể là một lựa chọn nhưng với nền tảng java mà nó chạy, tôi không muốn bị đau đầu. Tôi đã thử nó có, nhưng máy java này và phần còn lại không được tốt lắm với nhu cầu của tôi về thời gian đáp ứng lưu trữ và an toàn.
Tùy chọn chống trùng lặp có sẵn trong Linux, trên BTRFS và ZFS của hệ thống tệp. BTRFS được phát triển tự nhiên trong linux và có công cụ chống trùng lặp ngoại tuyến. Tôi không nghĩ 'ngoại tuyến', bạn phải vượt qua fs. Phương tiện ngoại tuyến, dữ liệu được viết chủ động không bị trùng lặp. Nhưng sau này bạn chạy công cụ cho suy nghĩ trùng lặp được lưu trữ bây giờ. Trên thực tế có lẽ công cụ đang trong giai đoạn thử nghiệm. Cách khác là trong ZFS. Sẵn có dưới dạng FUSE và nguyên bản: http://zfsonlinux.org/ . Điều này làm trùng lặp trực tuyến, không may điều này làm chậm viết vì tất cả phải được tính toán nhanh chóng. Bạn có thể trực tuyến tắt và về hành vi này. Sau khi bạn tắt trùng lặp, tất cả dữ liệu trùng lặp sẽ vẫn được lưu trữ dưới dạng trùng lặp. Bài viết mới sẽ được lưu trữ dưới dạng 'trùng lặp'. Nếu bạn muốn sao chép dữ liệu đó trong tương lai, bạn phải bật sao chép và viết lại tất cả các tệp 'trùng lặp'.
Xem tài liệu có sẵn trên trang. Để tăng tốc độ ghi và đọc, bạn có thể thêm các thiết bị nhanh hơn vào nhóm lưu trữ (đặc biệt là ổ SDD hoặc có thể flash USB nhanh hơn, chú ý đến độ tin cậy của thiết bị).
DRBD làm điều đó và làm nó thực sự tốt! Có thể làm Master / Slave hoặc Master / Master :-)