Sao chép có thể , nhưng bài đăng đó ở trên cửa sổ MS, của tôi là trên Linux và tôi không thể giải quyết vấn đề của mình khi đọc bài đăng đó.
Thông số kỹ thuật:
- Bo mạch chủ: AsRock H170 Pro4 / Hyper
- CPU: Intel G4400
- GPU: 6 x Gigabyte GTX 1070
- PSU: Corsair 1500W
- HĐH: Máy tính để bàn Ubuntu 16.04 LTS
Ghi chú: đây là một giàn khai thác.
5 GPU được kết nối với bo mạch chủ thông qua x1 PCIe riser, GPU thứ 6 kết nối với bo mạch chủ thông qua khe cắm M2. Các riser PCIe và GPU không phải là vấn đề vì đối với bất kỳ sự kết hợp nào của 4 trong số 6 thẻ. Hệ thống hoạt động như mong đợi.
Khi tất cả 6 thẻ được cài đặt vào bo mạch chủ,
lspci | grep -i vga
báo cáo tất cả 6 thẻ có busID từ 1 đến 6, nhưng chỉ có 4 thẻ được phát hiện bởi nvidia-smi
và hoạt động.
dmesg | grep -i nvidia
báo cáo điều này cho 2 thẻ không được phát hiện bởi smi (busID hoặc 4 và 5, 5 và 6 hoặc 4 và 6):
NVRM: This PCI I/O region assigned to your NVIDIA device is invalid:
Vì vậy, tôi nghĩ rằng chipset của tôi không có đủ các làn PCIe và x4 của M2 đã chiếm hết làn, nhưng khi tôi tìm trong trang chính của Intel. Chipset Intel H170 (chipset bo mạch chủ của tôi) có 16 làn PCIe. 5 GPU của tôi (x1), 2 trong số đó sử dụng các làn CPU (khe x8 và x16), vì vậy 3 + 4 (khe M2) = 7 làn được lấy từ chipset 16 làn PCIe. Do đó, bo mạch chủ của tôi sẽ có thể xử lý 6 GPU, phải không? Làm thế nào để tôi có được nó đi?
lspci -vvv
là bắt buộc, xấu của tôi. Bạn có thể thử một cái gì đó như lspci -vvv -d 10de:
để lọc các thiết bị NVIDIA.
lspci -v