Các câu trả lời trước cho câu hỏi này đã bao gồm hầu hết các điểm nổi bật, nhưng tôi muốn thêm một nhận xét liên quan đến vấn đề này:
MKL có ưu thế cho một số nhiệm vụ không?
Nhóm MKL ở một vị trí duy nhất để biết về các tập lệnh của Intel trong tương lai và việc triển khai chúng trong các bộ xử lý cụ thể. Hơn nữa, họ có quyền truy cập vào bộ mô phỏng bộ xử lý độc quyền và phần cứng tiền sản xuất mà không ai ngoài Intel có thể sử dụng. Do đó, MKL có ưu thế về mức độ hiểu biết về các sản phẩm trong tương lai và khi họ có được kiến thức này. Do đó, không quá ngạc nhiên nếu họ tạo ra các triển khai BLAS tốt hơn bất kỳ ai khác, ít nhất là sớm trong vòng đời của một sản phẩm có các tính năng mới.
Mặt khác, Intel đã khá cởi mở về tập lệnh AVX-512 và đã cung cấp Trình mô phỏng phát triển phần mềm Intel® (SDE) cho phép các nhà phát triển mô phỏng các hướng dẫn AVX-512 trên các bộ xử lý không hỗ trợ các bộ xử lý này. Do đó, sẽ không quá ngạc nhiên nếu việc triển khai BLAS nguồn mở chất lượng cao có sẵn cho các bộ xử lý Intel hỗ trợ AVX-512 sớm trong vòng đời của các sản phẩm này.
Tất nhiên, có bao nhiêu sự khác biệt để có thông tin chi tiết về một bộ xử lý cụ thể so với các nguyên tắc cơ bản của thuật toán đại số tuyến tính dày đặc không được giải quyết đầy đủ. Các trích dẫn sau đây giải quyết vấn đề này tốt hơn tôi có thể:
Về lý thuyết, không có sự khác biệt giữa lý thuyết và thực hành. Nhưng, trong thực tế, có.
Tiết lộ đầy đủ: Tôi làm việc cho Intel.