Bạn phải xem xét các GPU khi tìm nạp dữ liệu để nạp vào các shader đỉnh đòi hỏi rất nhiều cuộc gọi nhỏ vì chúng chỉ có thể lưu trữ một vài hình tam giác cùng một lúc và tìm nạp dữ liệu từ VRAM là một hoạt động rất chậm. Vì vậy, tôi cho rằng nếu bạn sử dụng một nửa byte cho các chỉ mục, GPU sẽ có thể tìm nạp hai lần các chỉ số cho bộ đệm để hiển thị hình tam giác.
4MB Có thể là một lượng bộ nhớ nhỏ cho không gian lưu trữ, nhưng nếu bạn phải thực hiện một cuộc gọi phức tạp để chỉ xử lý một vài byte từ chúng, điều đó có thể ảnh hưởng đến hiệu suất theo cách đáng chú ý. Ngày nay, thẻ video đủ mạnh để khiến nó không liên quan trong các trò chơi không phải xử lý nhiều hình học, bạn ... có thể thực hiện một số điểm chuẩn hiển thị mô hình với cả hai kích thước chỉ mục nếu bạn thực sự muốn biết.
Thời gian tải cũng nhanh hơn với các chỉ số 16 bit và thực tế là mỗi lần ghi hoặc đọc, trừ khi bạn có thể kiểm soát hiệu quả căn chỉnh bộ nhớ và phân trang thích hợp. Vì vậy, nó không chỉ là về bộ nhớ mà nó đòi hỏi mà còn phải mất bao nhiêu để xử lý nó. Nếu bạn đang làm việc với các bộ đệm động cần được chuyển qua xe buýt đến GPU tại một số điểm giữa các Khung, thì bạn nên sử dụng các chỉ số 16 bit khi có thể. Nếu bạn đang hiển thị hình học thậm chí nhỏ hơn, bạn có thể bó nhiều chỉ mục trong một bộ đệm chỉ mục 16 bit cho tất cả chúng để được sao chép vào GPU trong một cuộc gọi.
Tại đây bạn có thể tìm thấy một số thông tin về cách thức hoạt động của GPU ATI mới hơn:
Tài nguyên đào tạo nhà phát triển ATI Stream
(xin lỗi tôi không thể tìm thấy tài liệu chính xác) Tôi đã không đọc nhiều về các NVidia, nhưng tôi nghĩ rằng chúng hoạt động ít nhiều với cách tiếp cận tương tự.