Condor, OGE và Torque đều có thể đưa bạn đến đó nhưng chỉ Condor mới có quản lý phụ thuộc tích hợp với công cụ DAGMan . DAGMan cho phép bạn thiết lập một biểu đồ tuần hoàn, có hướng, mô tả luồng công việc của bạn và người quản lý đảm nhiệm việc di chuyển qua các công việc trong quy trình công việc của bạn và đánh giá kết quả đạt / thất bại ở mỗi bước trong luồng. Condor tương đối không biết nền tảng, điều đó có nghĩa là DAGMan cũng vậy, và bạn chắc chắn có thể có một bước con chạy trên AIX khi cha mẹ chạy trên Linux hoặc Windows. DAGMan không quan tâm đến việc các công việc chạy ở đâu, chỉ là các mã thoát bị vượt qua hoặc thất bại.
Bất kỳ lời khuyên nào cho việc chọn phần mềm hoặc tốt hơn là nên đi nguồn mở hoặc thương mại?
Với một số cảnh báo tôi nghĩ rằng các cộng đồng miễn phí trong không gian này rất đáng để xem xét.
OGE đang ở trong một không gian kỳ lạ. Không còn tự do chạy biến thể GE do Oracle sản xuất và Oracle không còn đóng góp mã mà nó viết lại cho GE SCC, nhưng có một số nhánh mã đang tồn tại trong các dự án nguồn mở, miễn phí. Univa đặc biệt đã dẫn đầu về việc thuê các nhà phát triển Sun GE cũ để tiếp tục làm việc trên một biến thể GE nguồn mở, miễn phí. Grid Engine có hai thứ phù hợp với nó: dễ cài đặt, nó có thể xử lý các công việc chạy ngắn (<2 phút) mà không truyền nhiều chi phí lên lịch cho các công việc làm chậm thông lượng. Nhược điểm lớn của nó là không hỗ trợ rất tốt cho Windows. Một số người trong chúng ta đã nỗ lực để chuyển nó sang Cygwin từ nhiều năm trước, nhưng chắc chắn nó không tốt như bản địa.
Bây giờ Condor là yêu thích của tôi trong ba công nghệ bạn đã đề cập. Có một cộng đồng mạnh mẽ xung quanh Condor và phần mềm rất trưởng thành (> 20 tuổi bây giờ). Hỗ trợ hệ điều hành Windows và POSIX gốc có nghĩa là nó chạy rất tốt ở mọi nơi. DAGMan đã nói ở trên chỉ là một trong nhiều tác phẩm tuyệt vời đi kèm với Condor. Nó có thể là một liên lạc phức tạp để thiết lập, nhưng một khi nó hoạt động và nó hoạt động ổn định. Nó có một ngôn ngữ cực kỳ linh hoạt để thực hiện công việc <-> khớp máy và xây dựng quy tắc sử dụng cho tài nguyên của bạn. Nó cũng hỗ trợ cung cấp động trên máy, cho phép các công việc chọn bao nhiêu tài nguyên máy họ cần và sau đó quảng cáo lại sự khác biệt như vẫn có sẵn. Nó hỗ trợ các bộ đếm tài nguyên toàn cầu để bạn có thể hạn chế những thứ như giấy phép phần mềm. Và tất nhiên, nó có DAGMan, một công cụ cực kỳ mạnh mẽ để quản lý quy trình làm việc. Nhược điểm của Condor là chi phí lập kế hoạch cho các công việc ngắn hạn có thể là gánh nặng. Bạn muốn các công việc chạy dài hơn 2 phút một cách lý tưởng, nếu không thì việc lên lịch bắt đầu trở thành một phần lớn thời gian của công việc trong hệ thống.
Mô-men xoắn là một chút thích hợp hơn. Tôi biết ít về nó tôi sợ. Nó so sánh với Grid Engine nhiều hơn Condor. Có những tiện ích trả phí mà @warren đề cập có thể mở rộng những gì Torque cơ bản, miễn phí có thể làm.
Nếu bạn muốn dùng thử ba công nghệ và xem cách chúng hoạt động với khối lượng công việc cụ thể của mình, CycleCloud có thể tạo ra các nhóm bảo mật, ảo hóa, được định cấu hình trước với Condor, GridEngine hoặc Torque - vì vậy không mất thời gian để tìm ra thứ đó về phía bạn Sẽ là một vài đô la để tạo ra các nhóm nhỏ của mỗi công nghệ và thử chúng với khối lượng công việc đại diện. (Tuyên bố miễn trừ trách nhiệm: Tôi làm việc cho Chu kỳ tính toán, chúng tôi thực hiện Chu kỳ)