Điều này là do sự kết hợp các tính năng của bộ xử lý hiện đại.
Điều đầu tiên góp phần vào IPS cao là thực tế là các bộ xử lý hiện đại có nhiều đơn vị thực thi có thể hoạt động độc lập. Trong hình ảnh bên dưới (mượn từ Wikipedia: Intel Core Microarch architecture ) bạn có thể thấy ở phía dưới có tám đơn vị thực thi (hiển thị màu vàng) có thể thực hiện đồng thời các lệnh. Không phải tất cả các đơn vị đó đều có thể bảo mật các loại hướng dẫn giống nhau, nhưng ít nhất 5 trong số chúng có thể thực hiện thao tác ALU và có ba đơn vị có khả năng SSE.
Kết hợp với một đường dẫn lệnh dài có thể xếp chồng các lệnh một cách hiệu quả sẵn sàng để các đơn vị đó thực hiện các lệnh ( ngoài trật tự , nếu cần thiết) có nghĩa là một bộ xử lý hiện đại có thể có một số lượng lớn các lệnh ngay lập tức tại bất kỳ thời điểm nào.
Mỗi hướng dẫn có thể mất một vài chu kỳ xung nhịp để thực thi, nhưng nếu bạn có thể song song hóa hiệu quả thực thi của chúng thì bạn có thể tăng cho IPS một cách hiệu quả với chi phí phức tạp của bộ xử lý và đầu ra nhiệt.
Giữ cho các đường ống lớn này có đầy đủ các hướng dẫn cũng cần một bộ đệm lớn có thể được điền sẵn các hướng dẫn và dữ liệu. Điều này góp phần vào kích thước của khuôn và cũng là lượng nhiệt mà bộ xử lý tạo ra.
Lý do điều này không được thực hiện trên các bộ xử lý nhỏ hơn là vì nó làm tăng đáng kể lượng logic điều khiển cần thiết xung quanh các lõi xử lý, cũng như lượng không gian cần thiết và cả nhiệt lượng được tạo ra. Nếu bạn muốn có một bộ xử lý nhỏ, công suất thấp, độ phản hồi cao thì bạn muốn có một đường ống ngắn mà không có quá nhiều thứ "phụ" xung quanh các lõi chức năng thực tế. Vì vậy, thông thường họ giảm thiểu bộ đệm, hạn chế chỉ một trong mỗi loại đơn vị được yêu cầu để xử lý các hướng dẫn và giảm độ phức tạp của mỗi phần.
Họ có thể tạo ra một bộ xử lý nhỏ phức tạp như bộ xử lý lớn hơn và đạt được hiệu suất tương tự, nhưng sau đó các yêu cầu về công suất và làm mát sẽ tăng theo cấp số nhân.