chuyển đổi dự phòng tốt / tính sẵn sàng cao cho linux? [đóng cửa]

9

Tôi có một số trường hợp tôi cần các ứng dụng được di chuyển từ máy chủ này sang máy chủ khác trong trường hợp xảy ra lỗi (máy chủ bị treo hoặc gặp sự cố).

Trên solaris, chúng tôi thực hiện điều này với VCS (Veritas Cluster Server). Những tùy chọn có sẵn cho Linux?

Vui lòng cho biết mức độ nỗ lực để thiết lập / bảo trì hoặc chi phí (nếu có) cho mỗi.

- Thêm chi tiết được thêm vào -

Để đưa ra một ý tưởng về mức độ phức tạp:

máy chủ bị lỗi có thể bị treo hoặc gặp sự cố mà không cần thông báo trước, vẫn có thể là 'khả năng ping'
máy chủ phục hồi cần khởi động ứng dụng của nó khi chuyển đổi dự phòng
một khi máy chủ không khởi động / chu kỳ điện, nó trở nên thụ động vì không phù hợp với máy chủ khôi phục.

Đây là một bộ sưu tập dữ liệu hoặc nút tính toán, không phải là cơ sở dữ liệu, vì vậy các giải pháp đơn giản hơn có thể hoạt động.

- thậm chí nhiều chi tiết hơn (xin lỗi) -

lưu trữ chia sẻ không phải là một tùy chọn, nhưng không có nhiều trạng thái (nếu có) cần di chuyển từ máy chủ này sang máy chủ khác. Chúng tôi giữ cho hai máy chủ đồng bộ thông qua rsync.

Cảm ơn bạn rất nhiều cho tất cả các bài viết cho đến nay.

— ericslaw
nguồn

10

http://linux-ha.org/ cho tất cả các nhu cầu sẵn có cao của bạn. Giống như bài hát nói, những điều tốt nhất trong cuộc sống là miễn phí.

— womble
nguồn

bạn có thể giới thiệu một cuốn sách tốt?

— slf

4

Tôi đã sử dụng một loạt các giải pháp cụm trên Linux. Tôi cũng là người đề xuất quản lý cấu hình, vì vậy tôi sẽ thêm một chút về điều đó trong phần mô tả của mình (Đầu bếp hoặc Con rối, nghĩa là)

Máy chủ cụm Veritas (VCS). Đã được một lúc, nhưng chúng tôi đã triển khai một số cụm Linux VCS trên RHEL 3.0. Tôi hy vọng nó có sẵn trên RHEL 5.0. Bạn nên làm quen với những khó khăn trong việc thiết lập điều này, như lãnh thổ quen thuộc của nó. Như bạn có thể biết, VCS rất đắt. Thông thường, VCS không phù hợp để được thiết lập bởi quản lý cấu hình.

Nói về RHEL, Red Hat Cluster Suite đã trưởng thành hơn rất nhiều kể từ khi phát hành lần đầu với RHEL 2.1. Giai đoạn thiết lập / cấu hình khá đơn giản và tài liệu rất đầy đủ và hữu ích, và giống như VCS, bạn có thể mua hỗ trợ từ nhà cung cấp. Đối với các sản phẩm HA thương mại, RHCS có giá hợp lý. Tôi sẽ chỉ sử dụng quản lý cấu hình để cài đặt các gói và duy trì chúng "bằng tay" thông qua giao diện web. Ngoài ra, tôi đã nghe nói về một số người sử dụng nó trên các nền tảng không phải Red Hat, mặc dù tôi không có kinh nghiệm trực tiếp với điều đó.

Linux-HA (drbd / heartbeat) cũng rất tuyệt, mặc dù đến từ VCS, cấu hình có vẻ đơn giản nhưng khó sử dụng. Điều này khá dễ dàng để tự động hóa với một công cụ quản lý cấu hình.

Như một bằng chứng về khái niệm, tôi đã cài đặt một cụm Linux với IBMMPMP - phần mềm phân cụm AIX của họ. Tôi sẽ không đề xuất điều này, vì tôi nhớ nó còn đắt hơn cả VCS. IBM có các quy trình cụ thể để cài đặt và duy trì HACMP, tôi sẽ không sử dụng quản lý cấu hình ở đây.

— jtimberman
nguồn

4

Michael là chính xác rằng cộng đồng là một chút rạn nứt ngay bây giờ, và tài liệu là một chút thưa thớt.

Trên thực tế, tất cả đều ở đó, thật không thể hiểu được. Những gì bạn thực sự muốn là ebook "Giải thích cấu hình máy tạo nhịp tim" ... ( Liên kết đến PDF ). Bạn sẽ muốn đọc nó khoảng một chục lần, và sau đó cố gắng thực hiện nó, và sau đó đọc nó một chục lần nữa để bạn thực sự có thể mò mẫm nó.

Việc triển khai các dịch vụ cụm được hỗ trợ tốt nhất cho Linux vào thời điểm này có lẽ sẽ là SLES11 của Novell và đó là Tiện ích mở rộng có tính sẵn sàng cao (HAE). Nó CHỈ xuất hiện một hoặc hai tháng trước, và nó đi kèm với một hướng dẫn 200 trang dày đẹp mô tả cách thiết lập và vận hành mọi thứ. Novell cũng đã rất xuất sắc trong việc hỗ trợ các cấu hình Máy tạo nhịp tim dưới nhiều hình thức khác nhau.

Ngoài ra, có triển khai của RHEL5, có cùng gói và tài liệu phù hợp, nhưng tôi nghĩ nó đắt hơn SLES. Ít nhất, nó là dành cho chúng tôi.

Tôi sẽ tránh Heartbeat ngay bây giờ và đi với Pacekmaker / OpenAIS vì họ sẽ được hỗ trợ tốt hơn nhiều trong tương lai. TUY NHIÊN, tình trạng hiện tại của cộng đồng là có một vài chuyên gia, có một vài người đang điều hành nó trong sản xuất, và có cả tấn người hoàn toàn không biết gì. Tham gia danh sách gửi thư của Pacemaker và chú ý đến một người đàn ông tên Andrew Beekhof.

Chỉnh sửa để cung cấp chi tiết được yêu cầu:

Máy tạo nhịp tim / OpenAIS sử dụng thao tác 'màn hình' trên 'tài nguyên nguyên thủy' (ví dụ: máy chủ nfs) để theo dõi những gì tài nguyên đang làm. Nếu máy chủ NFS mẫu không phản hồi với phần còn lại của cụm trong số giây X, thì cụm sẽ thực hiện thao tác STONITH (Shoot The Other Node In The Head) để tắt nút chính, thúc đẩy nút phụ hoạt động. Bạn quyết định trong cấu hình những gì sẽ đưa ra sau đó và các hành động liên quan để thực hiện. Chi tiết triển khai từ đó phụ thuộc vào dịch vụ mà bạn đang cố gắng thực hiện không thành công, cửa sổ thực thi cho các hoạt động nhất định (chẳng hạn như thúc đẩy nút chính trở lại chính) và toàn bộ điều có thể cấu hình càng nhiều càng tốt.

— Karl Katzke
nguồn

1

Hiện tại cộng đồng Linux HA có một chút phân vùng.

Các công cụ trước đây được biết đến vì Linux HA hiện đang là Pacemaker và OpenAIS , những công cụ này thường được chạy kết hợp với DRBD khi cần một kiến trúc không chia sẻ.

Tôi khuyên bạn nên có một cuốn sách hay về chủ đề này trước khi đi sâu vào, vì đây là một lĩnh vực khá toàn diện và trạng thái của các dự án không nhất thiết phải thân thiện với người dùng như một số giải pháp của nhà cung cấp.

Ngoài ra còn có các giải pháp Linux của một số nhà cung cấp phần mềm cụm, nhưng tôi không thể nói cho bạn biết nhiều về những giải pháp đó vì tôi chưa bao giờ sử dụng chúng.

— Michael Renner
nguồn

1

Bạn có thể đề nghị một hoặc hai cuốn sách hay về chủ đề này?

— Matt Simmons

1

Với Linux, chúng tôi đã triển khai phân cụm với heartbeat và drbd. Nhịp tim kiểm tra trạng thái của máy chủ. DRBD được sử dụng để đồng bộ dữ liệu giữa các máy chủ. Chúng tôi có dịch vụ tiên tri chạy trên một máy chủ và apache trên một máy chủ khác. Khi máy chủ chạy orory không thành công, heartbeat cũng cảm nhận tương tự và khôi phục dịch vụ oracle trên máy chủ đang chạy apache. và ngược lại. Đã được sử dụng thiết lập này cho nhiều mục đích khác và đáng tin cậy cho đến nay.

— Viky
nguồn

1

Red Hat Cluster Suite sẽ làm những gì bạn muốn cho mọi ứng dụng có thể. Kết hợp với GFS và Cluster LVM, bạn có thể có bộ nhớ chia sẻ vững chắc.

Bảo trì không khó khăn hơn nhiều sau đó giữ cho các hộp riêng lẻ chạy. Việc di chuyển ứng dụng làm cho việc vá các hộp riêng lẻ dễ dàng hơn.

RHCS đi kèm với một frontend web (Luci) và một frontend GTK (system-config-cluster) để làm cho cấu hình và di chuyển có thể nhấp được. Nó sẽ cho phép bạn định cấu hình miền chuyển đổi dự phòng cho mỗi ứng dụng, chính sách khôi phục, tạo hàng rào, tất cả từ một bảng điều khiển quản lý dựa trên web trung tâm.

Xem xét thực tế rằng RHCS thực sự có một tùy chọn hỗ trợ khá vững chắc, tôi sẽ chọn RHCS.

Không chắc cái này sẽ tốn bao nhiêu tiền, nhưng tôi nghĩ nó nằm trong khoảng vài ngàn đô la.

— wzzrd
nguồn

1

UltraMonkey , một phần được xây dựng dựa trên khung Linux-HA. Tôi đã luôn nghĩ về nó như là một giải pháp cân bằng tải hơn là một cụm thực sự, nhưng nó xử lý tốt sự cố.

— gbjbaanb
nguồn

— NickW

0

Chúng tôi sử dụng Linux Virtual Server và được bảo quản vì tính sẵn sàng cao của chúng tôi. Keepaliving có thể tự thực hiện VRRP trên các máy chủ (mà tôi tin là phụ thuộc vào máy chủ khác sắp chết) hoặc bạn có thể thiết lập nó trên một máy chủ riêng để thực hiện cân bằng tải, có thể kiểm tra tính khả dụng của dịch vụ. Có thể định cấu hình kiểm tra dịch vụ trong tình huống đầu tiên nhưng tôi chưa kiểm tra. Tình huống thứ hai đặc biệt tốt nếu bạn có thể có cả hai máy chủ chạy cùng một lúc, nếu không bạn có thể thực hiện chuyển đổi thủ công.

— David Pashley
nguồn

0

Tôi đã viết một bộ cân bằng tải dựa trên phần mềm cho TCP mà không yêu cầu một máy riêng. Nó chia sẻ một địa chỉ IP duy nhất bằng cách thông báo nó trên một địa chỉ cấp liên kết đa hướng và đàm phán giữa các máy để tránh hai máy phục vụ cùng một kết nối TCP.

Mặt trái là nó không thực sự sẵn sàng sản xuất - nhưng nếu bạn muốn thử nghiệm nó trên mạng thử nghiệm của mình, tôi sẽ hài lòng.

Fluffy cluster là ở đây

Tôi không nhất thiết phải phát hiện tình huống "còn sống nhưng bị bệnh", nhưng tôi thực hiện cân bằng tải giữa các máy chủ thành viên (nếu quá trình không gian người dùng chết, các nút khác sẽ chú ý và loại bỏ nút thất bại)

— Đánh dấu
nguồn

0

Nó không miễn phí, nhưng những người không có thời gian hoặc chuyên môn để cài đặt giải pháp HA của riêng họ trên Linux, câu trả lời là tại www.rapidscalecl cluster.com. Trong vài phút bạn đã khởi động và chạy, dễ cài đặt và chạy, nó cũng được hỗ trợ.

— Hoàng tử Bryant
nguồn

không chắc chắn tại sao ai đó đánh dấu điều này xuống ... đây có vẻ là một giải pháp khả thi (mặc dù luôn có các vấn đề kỹ thuật ... ít nhất đây không giống như một "dịch vụ", đó là ấn tượng đầu tiên của tôi).

— ericslaw

0

Tôi đang làm việc trên một trình quản lý cụm chuyển đổi dự phòng nguồn mở được viết bằng shell script. Đó là trong tình trạng tốt ngay cả khi nó có thể bỏ lỡ một số tích hợp bạn sẽ cần. Hãy xem thử và cho tôi biết nếu có một số tính năng bị thiếu mà bạn muốn xem và sử dụng: https://github.com/nackstein/back-to-work/

nếu bạn giỏi lập trình shell (POSIX shell), bạn có thể tham gia phát triển dự án: D

— Luigi
nguồn