hệ thống tập tin nhân đôi trên một vài máy chủ


13

Tôi đang tìm kiếm một giải pháp để nhân bản hoặc sao chép một thư mục (hoặc một hệ thống tệp) trên một vài máy chủ Linux. Giải pháp lý tưởng sẽ là một, cho phép tất cả các máy chủ truy cập đọc-ghi. Tôi cũng muốn nó cho tôi khả năng phục hồi, nếu một trong các máy chủ ngừng hoạt động, phần còn lại vẫn sẽ hoạt động mà không mất bất kỳ dữ liệu nào.

Tôi đã xem xét một số giải pháp:

  • DRBD : sao chép mức khối, có vẻ hơi quá mức;
  • lsyncd : trông rất đơn giản, nhưng tôi nghi ngờ về hiệu suất;
  • GlusterFS : có vẻ như đó sẽ là một trận đấu hay, chưa tìm ra chính xác chế độ sao chép hoạt động như thế nào. Nó sẽ có những đặc điểm tôi yêu cầu?

Những đề nghị khác dều được hoan nghênh.


Bạn đang xem một thiết lập không chia sẻ gì hay bạn sẽ kết nối tất cả các máy chủ với cùng một SAN phụ trợ?
HampusLi

về mặt logic, nó được chia sẻ - không có gì (về mặt vật lý là EC2 với EBS).
vartec

Câu trả lời:


6

Câu hỏi đầu tiên tôi muốn hỏi là bạn có muốn nhân rộng này sang hai máy chủ trở lên sau đó là hai máy chủ không? Đối với hai máy chủ tôi sẽ sử dụng DRDB, với ba hoặc nhiều hơn tôi sẽ sử dụng ánh sáng.

Nếu độ trễ I / O không phải là một mối quan tâm quan trọng, tôi sẽ đi với ánh sáng. Nó khá dễ dàng để thiết lập và rõ ràng có thể làm những gì bạn cần. Tất cả những gì bạn cần làm là tạo một máy chủ gluster phục vụ các tệp trên cả ba hộp và sau đó cũng làm cho mỗi hộp hoạt động như một máy khách gluster gắn các tệp.

DRDB sẽ trở nên phức tạp để hoạt động ở chế độ chính <-> với 3 máy chủ trở lên. Bạn phải cấu hình một thiết lập dựa trên vòng và tôi sẽ không khuyến nghị nó. Tuy nhiên, đối với hai máy chủ DRDB là tuyệt vời. Chế độ chính <-> Chế độ chính không phức tạp để thiết lập và bạn không phải tìm hiểu bất kỳ nội dung nào của hệ thống tệp.

lsycd là tuyệt vời cho một thiết lập chủ / nô lệ, nhưng bạn dường như không muốn điều đó.

Ceph vẫn còn khá mới, lần trước tôi đã kiểm tra nó thậm chí còn chưa có hỗ trợ fsck. Tôi thà dựa vào cơ sở hạ tầng của mình trên một cái gì đó ổn định hơn.

Luster là một sản phẩm tuyệt vời để triển khai quy mô lớn, nhưng bạn cần thiết lập nhịp tim và chuyển đổi dự phòng cho máy chủ mds hoặc nó sẽ có một điểm thất bại duy nhất. Với số lượng máy chủ hạn chế mà anh ta đang nói về tôi nghi ngờ sự quá mức của nó trong trường hợp này.


Ban đầu tôi sẽ bắt đầu chỉ với 2 máy chủ trên mỗi cụm, nhưng tôi muốn có tùy chọn để có nhiều hơn 2 máy chủ để mở rộng quy mô; Thiết lập ánh sáng mà bạn mô tả, liệu nó có xử lý được một trong các máy chủ bị sập không? Sẽ dễ dàng để thêm máy chủ?
vartec

2

Làm thế nào về Ceph hoặc Luster ?


Luster có hỗ trợ Ubuntu Server không? Tôi đang kiểm tra Ceph, cảm ơn vì đã gợi ý.
vartec

Từ wiki ceph: "Ceph đang được phát triển mạnh mẽ và chưa phù hợp cho bất kỳ mục đích sử dụng nào ngoài việc đánh giá và đánh giá." Ceph.newdream.net/wiki
Jeff Busby

2

Bạn nên xem xét OpenAFS - đó là một hệ thống tệp được phân phối chủ yếu cho phép tồn tại nhiều bản sao dữ liệu được phân phối trên toàn cụm và mọi người có thể đọc / ghi vào FS cùng một lúc.

Nó cũng có một loạt các tính năng hữu ích khác (xác thực tốt, mã hóa trên dây, bộ nhớ đệm cục bộ tích hợp trên máy khách, máy khách windows gốc, di động qua nhiều phiên bản của unix, v.v.)

Tuy nhiên, đó là một chút khó khăn để thiết lập.


cùng một câu hỏi như với NFS: "cho phép nhiều bản sao". OK, nhưng nó có quan tâm đến việc thực sự đồng bộ hóa các bản sao này không?
vartec

Vâng. Và có thể, mặc dù khó chịu, để phục hồi sau khi mất chủ chính. Nhưng thật tầm thường khi có nhiều người viết và các khối kết quả được lưu trữ trên nhiều máy chủ.
chris

Chìa khóa để hiểu OpenAFS là nó là một hệ thống quản lý bộ đệm - có một không gian tên (chỉ tồn tại một "tệp" IE) nhưng có các bản sao của tệp được lưu trong bộ nhớ cache ở mọi nơi và một giao thức để đảm bảo rằng tất cả các bản sao được lưu trong bộ nhớ cache đều nhất quán . Nếu bạn mất bản gốc, bạn có thể biến một trong các bản sao được lưu trong bộ nhớ cache thành bản gốc, nhưng không lý tưởng khi ở trong tình huống đó.
chris

1

NFS cũng có thể hoạt động tốt, tùy thuộc vào nhu cầu của bạn.


AFAIK, NFS không cung cấp cách để gắn kết các máy chủ được sao chép, nhưng không phải là bản sao. Nhưng tôi đã không sử dụng NFS trong một thời gian dài, nên có lẽ điều đó đã thay đổi. Bạn có thể liên kết đến các tài liệu NFS mô tả thiết lập như vậy không?
vartec

Một cách thoát khỏi đỉnh đầu của tôi sẽ là sao chép các thư mục đến một số máy chủ nfs, một trong số đó có một vip chính và di chuyển vip qua các máy chủ nếu một máy chủ bị hỏng. Hoặc vòng tròn dns có thể. Bản thân NFS có thể không làm mọi thứ bạn cần, nhưng kết hợp với các dịch vụ cụm nhịp tim hoặc mũ đỏ, đó có thể là những gì bạn cần. Tôi không chắc câu hỏi ban đầu có tất cả các yêu cầu trong đó. Bạn thậm chí có thể thực hiện rsync trên một loạt các máy chủ, mỗi giờ hoặc lâu hơn, để có một giải pháp thực sự nhanh chóng và dễ dàng.
lsd

Bỏ qua phần về rsync. Nó sẽ thực hiện sao chép, nhưng chủ yếu là cho các thiết lập chỉ đọc, không phù hợp với yêu cầu của bạn. Tôi có ý định chỉnh sửa nhận xét của tôi ở trên, nhưng nó sẽ không cho phép tôi.
lsd

1

Làm cho điều này hoạt động với DRBD sẽ rất khó khăn - vấn đề không phải là do n8whnp dường như nghĩ rằng một vấn đề liên quan đến sao chép đa chiều (bạn chỉ tạo ra tất cả các nút trong một bộ gương) mà là kiểm soát tương tranh - bạn ' d cần chạy một hệ thống tập tin cụm trên đầu phản chiếu trên đầu DRBD.

lsyncd thậm chí còn tệ hơn vì không có giải pháp thực tế nào cho việc kiểm soát tương tranh.

Tôi muốn giới thiệu một giải pháp loại AFS (AFS, OpenAFS) là một giải pháp mở, ổn định, mở. Tôi sẽ tránh xa ánh sáng kể từ khi Oracle đóng cửa nó. Không quá quen thuộc với glusterfs nhưng vì nó phụ thuộc vào bộ lưu trữ phân tán thay vì sao chép, tôi khuyên bạn nên xem xét kỹ về cách hoạt động của bộ não (AFS OTOH được thiết kế để hoạt động ở chế độ ngắt kết nối).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.