Tôi nhận thấy rằng các câu trả lời trước thiếu một số cân nhắc chung về HPC.
Trước hết, cả hai gói này đều không cho phép bạn chạy song song một SVM. Vì vậy, những gì bạn có thể tăng tốc là tối ưu hóa tham số hoặc xác thực chéo, bạn vẫn phải viết các chức năng của riêng mình cho điều đó. Hoặc tất nhiên bạn có thể chạy công việc cho các bộ dữ liệu khác nhau song song, nếu đó là một trường hợp.
Vấn đề thứ hai là bộ nhớ; nếu bạn muốn truyền bá tính toán trên một vài máy tính vật lý, không có bữa ăn trưa miễn phí và bạn phải sao chép dữ liệu - ở đây bạn phải xem xét liệu có hợp lý để phân phối một bản sao dữ liệu trên các máy tính để lưu một số liên lạc. Mặt khác, nếu bạn muốn sử dụng nhiều lõi trên một máy tính, thì đa lõi đặc biệt thích hợp vì nó cho phép tất cả các tiến trình con truy cập vào bộ nhớ của tiến trình cha, vì vậy bạn có thể tiết kiệm thời gian và nhiều dung lượng bộ nhớ.