Câu trả lời:
Có (ít nhất) hai yếu tố chơi ở đây. GPU có thể sử dụng bộ đệm đỉnh biến đổi sau khi biến đổi nguyên thủy được lập chỉ mục. Kích thước của bộ đệm này khác nhau và được sử dụng trong một cuộc gọi rút thăm riêng lẻ (không phải qua nhiều cuộc gọi, theo như tôi biết, do đó, việc bạn thay đổi dữ liệu bộ đệm trong ngữ cảnh đó có thường xuyên không).
Nếu bạn sắp xếp dữ liệu của mình để tận dụng bộ đệm này (thuật toán ví dụ ở đây ), bạn có thể thấy các cải tiến hiệu suất. Tuy nhiên, tổ chức này có liên quan nhiều hơn đến việc sắp xếp các chỉ số của bạn để mỗi chỉ số ba lần sử dụng lại càng nhiều đỉnh được nhìn thấy gần đây càng tốt. Nó có thể có ít ảnh hưởng đến kịch bản cụ thể của bạn, trừ khi các hình tam giác của bạn, thông qua bộ đệm chỉ mục của bạn, cũng được phân tán ngẫu nhiên trong bộ đệm ... trong trường hợp đó bạn có thể thường xuyên thổi bộ đệm. Tôi không rõ ràng trong câu hỏi của bạn cho dù đây có phải là trường hợp hay không, vì vậy tôi nghĩ rằng nó đáng được đề cập.
Điều có nhiều khả năng là một vấn đề là GPU cũng lưu trữ bộ nhớ cache truy cập vào dữ liệu đỉnh trong khi rút thăm. Kích thước của bộ đệm đó cũng có kích thước khá không đáng tin cậy và có thể hình dung rằng bạn có thể có tần số bỏ lỡ cao trong bộ đệm đó trên các lõi riêng lẻ xử lý các chỉ số đó thành dữ liệu đỉnh được định vị rất kém.
Về việc có hay không điều đó sẽ gây ra đủ vấn đề về hiệu năng trở thành cờ đỏ trong ứng dụng của bạn và đặc biệt (nghe có vẻ như) để thiết kế lại thuật toán của bạn để tổ chức dữ liệu tốt hơn với chi phí dễ đọc của thuật toán ... Đó không phải là điều tôi có thể trả lời, bạn sẽ phải ghi lại một số tình huống và xem.
Tuy nhiên, cá nhân tôi sẽ nhầm lẫn về mặt mã có thể đọc được, có thể duy trì được, vì tôi nghĩ rằng bất kỳ bộ nhớ cache nào bạn sẽ gây ra sẽ không đủ ý nghĩa để người dùng chú ý.