Sắp xếp mất O (n log n) trong trường hợp nối tiếp. Nếu chúng ta có bộ xử lý O (n), chúng ta sẽ hy vọng tăng tốc tuyến tính. Các thuật toán song song O (log n) tồn tại nhưng chúng có hằng số rất cao. Chúng cũng không áp dụng được trên phần cứng hàng hóa không có bộ xử lý O (n). Với bộ xử lý p, các thuật toán hợp lý sẽ mất thời gian O (n / p log n).
Trong trường hợp nối tiếp, sắp xếp nhanh có độ phức tạp thời gian chạy trung bình tốt nhất. Một thuật toán sắp xếp nhanh song song rất dễ thực hiện (xem tại đây và đây ). Tuy nhiên, nó không hoạt động tốt vì bước đầu tiên là phân vùng toàn bộ bộ sưu tập trên một lõi. Tôi đã tìm thấy thông tin về nhiều thuật toán sắp xếp song song nhưng cho đến nay tôi chưa thấy bất cứ điều gì chỉ ra một người chiến thắng rõ ràng.
Tôi đang tìm cách sắp xếp danh sách từ 1 triệu đến 100 triệu phần tử trong ngôn ngữ JVM chạy trên 8 đến 32 lõi.