Câu hỏi được gắn thẻ «compiler-optimization»

Tối ưu hóa trình biên dịch liên quan đến việc điều chỉnh trình biên dịch để giảm thời gian chạy hoặc kích thước đối tượng hoặc cả hai. Điều này có thể được thực hiện bằng cách sử dụng các đối số trình biên dịch (ví dụ CFLAGS, LDFLAGS), trình cắm trình biên dịch (ví dụ DEHYDRA) hoặc sửa đổi trực tiếp cho trình biên dịch (chẳng hạn như sửa đổi mã nguồn).



10
Thay thế bộ đếm vòng lặp 32 bit bằng 64 bit giới thiệu độ lệch hiệu năng điên rồ bằng _mm_popcnt_u64 trên CPU Intel
Tôi đang tìm cách nhanh nhất cho popcountcác mảng dữ liệu lớn. Tôi đã gặp một hiệu ứng rất kỳ lạ : Thay đổi biến vòng lặp từ unsignedđể uint64_tlàm cho hiệu suất giảm 50% trên PC của tôi. Điểm chính xác #include <iostream> #include <chrono> #include <x86intrin.h> int main(int …




12
Làm cách nào để biên dịch Tensorflow với hướng dẫn SSE4.2 và AVX?
Đây là thông báo nhận được từ việc chạy tập lệnh để kiểm tra xem Tensorflow có hoạt động không: I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcublas.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcudnn.so.5 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library libcufft.so.8.0 locally I tensorflow/stream_executor/dso_loader.cc:125] successfully opened CUDA library …









Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.