Ngoài việc tăng dung lượng lưu trữ thô của RAM, bộ nhớ cache, đăng ký và cũng như thêm nhiều lõi máy tính và độ rộng bus rộng hơn (32 so với 64 bit, v.v.), đó là do CPU ngày càng phức tạp.
CPU là các đơn vị tính toán được tạo thành từ các đơn vị tính toán khác. Một lệnh CPU trải qua nhiều giai đoạn. Vào thời xưa, có một giai đoạn và tín hiệu đồng hồ sẽ dài bằng thời gian trường hợp xấu nhất cho tất cả các cổng logic (được làm từ bóng bán dẫn) để giải quyết. Sau đó, chúng tôi đã phát minh ra ống lót, trong đó CPU được chia thành các giai đoạn: tìm nạp lệnh, giải mã, xử lý và ghi kết quả. CPU 4 tầng đơn giản đó có thể chạy ở tốc độ xung nhịp gấp 4 lần đồng hồ gốc. Mỗi giai đoạn, tách biệt với các giai đoạn khác. Điều này có nghĩa là không chỉ tốc độ xung nhịp của bạn có thể tăng lên gấp 4 lần (ở mức tăng gấp 4 lần) mà giờ đây bạn có thể có 4 hướng dẫn được xếp lớp (hoặc "pipelined") trong CPU, dẫn đến hiệu suất gấp 4 lần. Tuy nhiên, bây giờ "mối nguy" được tạo vì một lệnh đến có thể phụ thuộc vào kết quả của lệnh trước đó, nhưng vì nó ' Khi được xử lý, nó sẽ không nhận được khi nó bước vào giai đoạn quy trình khi một giai đoạn khác thoát khỏi giai đoạn quy trình. Do đó, bạn cần thêm mạch để chuyển tiếp kết quả này vào hướng dẫn bước vào giai đoạn quy trình. Thay thế là đình trệ các đường ống làm giảm hiệu suất.
Mỗi giai đoạn đường ống, và đặc biệt là phần quy trình, có thể được chia thành nhiều bước hơn. Kết quả là, cuối cùng bạn tạo ra một lượng lớn mạch điện để xử lý tất cả các phụ thuộc lẫn nhau (mối nguy hiểm) trong đường ống.
Các mạch khác cũng có thể được tăng cường. Một trình bổ sung kỹ thuật số tầm thường được gọi là trình bổ sung "ripple carry" là trình bổ sung dễ nhất, nhỏ nhất nhưng chậm nhất. Trình bổ sung nhanh nhất là một trình bổ sung "mang theo hướng nhìn về phía trước" và có một số lượng cực lớn theo cấp số nhân. Trong khóa học kỹ thuật máy tính của tôi, tôi đã hết bộ nhớ trong trình giả lập trình bổ sung nhìn phía trước 32 bit, vì vậy tôi đã cắt nó thành một nửa, 2 bộ cộng CLA 16 bit trong cấu hình Ripple-carry. (Cộng và trừ rất khó cho máy tính, nhân dễ, chia rất khó)
Một tác động phụ của tất cả điều này là khi chúng ta thu nhỏ kích thước của bóng bán dẫn và chia nhỏ các giai đoạn, tần số xung nhịp có thể tăng lên. Điều này cho phép bộ xử lý làm nhiều công việc hơn để nó chạy nóng hơn. Ngoài ra, khi sự chậm trễ tăng tần số lan truyền trở nên rõ ràng hơn (thời gian cần thiết để giai đoạn đường ống hoàn thành và để tín hiệu có sẵn ở phía bên kia) Do trở kháng, tốc độ lan truyền hiệu quả là khoảng 1 ft mỗi nano giây (1 Ghz). Khi tốc độ đồng hồ của bạn tăng lên, bố trí chip ngày càng trở nên quan trọng vì chip 4 Ghz có kích thước tối đa 3 inch. Vì vậy, bây giờ bạn phải bắt đầu bao gồm các xe buýt và mạch bổ sung để quản lý tất cả dữ liệu di chuyển xung quanh chip.
Chúng tôi cũng thêm hướng dẫn vào chip mọi lúc. SIMD (Hướng dẫn nhiều dữ liệu), tiết kiệm năng lượng, v.v ... tất cả đều yêu cầu mạch điện.
Cuối cùng, chúng tôi thêm nhiều tính năng hơn cho chip. Vào thời xưa, CPU và ALU của bạn (Đơn vị logic số học) là riêng biệt. Chúng tôi kết hợp chúng. FPU (đơn vị dấu phẩy động) là riêng biệt, cũng được kết hợp. Ngày nay, chúng tôi thêm USB 3.0, Tăng tốc video, giải mã MPEG, v.v ... Chúng tôi chuyển ngày càng nhiều tính toán từ phần mềm sang phần cứng.