GPU không được công nhận bởi nvidia-smi


1

Sao chép có thể , nhưng bài đăng đó ở trên cửa sổ MS, của tôi là trên Linux và tôi không thể giải quyết vấn đề của mình khi đọc bài đăng đó.

Thông số kỹ thuật:

Ghi chú: đây là một giàn khai thác.

5 GPU được kết nối với bo mạch chủ thông qua x1 PCIe riser, GPU thứ 6 kết nối với bo mạch chủ thông qua khe cắm M2. Các riser PCIe và GPU không phải là vấn đề vì đối với bất kỳ sự kết hợp nào của 4 trong số 6 thẻ. Hệ thống hoạt động như mong đợi.

Khi tất cả 6 thẻ được cài đặt vào bo mạch chủ,

lspci | grep -i vga

báo cáo tất cả 6 thẻ có busID từ 1 đến 6, nhưng chỉ có 4 thẻ được phát hiện bởi nvidia-smi và hoạt động.

dmesg | grep -i  nvidia

báo cáo điều này cho 2 thẻ không được phát hiện bởi smi (busID hoặc 4 và 5, 5 và 6 hoặc 4 và 6):

NVRM: This PCI I/O region assigned to your NVIDIA device is invalid:

Vì vậy, tôi nghĩ rằng chipset của tôi không có đủ các làn PCIe và x4 của M2 đã chiếm hết làn, nhưng khi tôi tìm trong trang chính của Intel. Chipset Intel H170 (chipset bo mạch chủ của tôi) có 16 làn PCIe. 5 GPU của tôi (x1), 2 trong số đó sử dụng các làn CPU (khe x8 và x16), vì vậy 3 + 4 (khe M2) = 7 làn được lấy từ chipset 16 làn PCIe. Do đó, bo mạch chủ của tôi sẽ có thể xử lý 6 GPU, phải không? Làm thế nào để tôi có được nó đi?


Phần sụn bo mạch chủ của bạn có thể có thể xử lý tất cả các vùng bộ nhớ được ánh xạ. // Vui lòng cung cấp đầu ra của lspci -v
Daniel B

@DanielB, có cách nào để tôi có thể vượt qua điều đó không ?? Vâng trước khi xem xét mua một mobo khác. Tôi đã cập nhật bios lên phiên bản mới nhất
Nhu Thai Sanh Nguyen

Không, không có cách nào. Thông số kỹ thuật của bạn đang thiếu dung lượng RAM.
Daniel B

Nó xuất hiện đầu ra của lspci -vvv là bắt buộc, xấu của tôi. Bạn có thể thử một cái gì đó như lspci -vvv -d 10de: để lọc các thiết bị NVIDIA.
Daniel B

wow, đó là rất nhiều đầu ra: |
Nhu Thai Sanh Nguyen
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.