Với Hadoop và CouchDB có trên Blog và các tin tức liên quan, bộ lưu trữ chịu lỗi phân tán (động cơ) thực sự hoạt động như thế nào.
- CouchDB thực sự không có bất kỳ tính năng phân phối nào được tích hợp sẵn, theo hiểu biết của tôi, chất keo để tự động phân phối các mục hoặc thậm chí toàn bộ cơ sở dữ liệu bị thiếu.
- Hadoop dường như được sử dụng rất rộng rãi - ít nhất là nó được báo chí tốt, nhưng vẫn có một điểm thất bại duy nhất: NameNode. Ngoài ra, nó chỉ có thể gắn kết thông qua FUSE, tôi hiểu rằng HDFS không thực sự là mục tiêu chính của Hadoop
- GlusterFS không có khái niệm gì được chia sẻ nhưng gần đây tôi đã đọc một số bài đăng dẫn tôi đến ý kiến nó không hoàn toàn ổn định
- Luster cũng có một điểm thất bại duy nhất vì nó sử dụng máy chủ siêu dữ liệu chuyên dụng
- Ceph dường như là người chơi được lựa chọn nhưng trang chủ cho biết nó vẫn đang trong giai đoạn alpha.
Vì vậy, câu hỏi là hệ thống tập tin phân tán nào có bộ tính năng sau (không có thứ tự cụ thể):
- Tương thích POSIX
- dễ dàng thêm / loại bỏ các nút
- khái niệm không chia sẻ
- chạy trên phần cứng giá rẻ (bộ xử lý lớp AMD Geode hoặc VIA Eden)
- xác thực / ủy quyền tích hợp
- một hệ thống tệp mạng (tôi muốn có thể gắn kết đồng thời trên các máy chủ khác nhau)
Rất vui được có:
- các tệp có thể truy cập cục bộ: Tôi có thể lấy một nút xuống gắn kết phân vùng với một hệ thống tệp cục bộ tiêu chuẩn (ext3 / xfs / sao ...) và vẫn truy cập các tệp
Tôi không tìm kiếm các ứng dụng được lưu trữ, thay vào đó là thứ gì đó sẽ cho phép tôi nhận 10GB mỗi hộp phần cứng của chúng tôi và có sẵn dung lượng lưu trữ trong mạng của chúng tôi, có thể dễ dàng gắn kết trên nhiều máy chủ.