Trong một GPU thực, thay vì có nhiều lõi cố gắng đọc / ghi cùng một vùng của bộ đệm độ sâu và cố gắng đồng bộ hóa giữa chúng, bộ đệm độ sâu được chia thành các ô (như 16 × 16 hoặc 32 × 32) và mỗi lõi gạch được gán cho một lõi đơn. Lõi đó sau đó chịu trách nhiệm cho tất cả quá trình rasterization trong ô đó: bất kỳ hình tam giác nào chạm vào ô đó sẽ được rasterized (trong ô đó) bởi lõi sở hữu. Sau đó, không có sự can thiệp giữa các lõi và không cần chúng phải đồng bộ hóa khi truy cập vào bộ phận của bộ đệm khung.
Điều này ngụ ý rằng các hình tam giác chạm vào nhiều ô sẽ cần được rasterized bởi nhiều lõi. Vì vậy, có một bước phân phối lại công việc giữa xử lý hình học (các thao tác trên các đỉnh và hình tam giác) và xử lý pixel.
Trong giai đoạn hình học, mỗi lõi có thể xử lý một khối nguyên thủy đầu vào; sau đó với mỗi nguyên thủy, nó có thể nhanh chóng xác định gạch nào chạm vào nguyên thủy (cái này được gọi là "rasterization thô") và thêm nguyên thủy vào hàng đợi cho mỗi lõi sở hữu một trong các gạch bị ảnh hưởng.
Sau đó, trong giai đoạn pixel, mỗi lõi có thể đọc danh sách các nguyên thủy trong hàng đợi của nó, tính toán độ bao phủ pixel cho các ô mà lõi sở hữu và tiến hành kiểm tra độ sâu, đổ bóng pixel và cập nhật bộ đệm khung, không cần phối hợp thêm với các lõi khác.