NVIDIA-SMI đã thất bại vì không thể giao tiếp với trình điều khiển NVIDIA. Đảm bảo rằng trình điều khiển NVIDIA mới nhất đã được cài đặt và chạy


22

Tôi vừa cài đặt CUDA trong một máy tính xách tay như thế này:

sudo apt-get install cuda

Giống như đã nói ở đây .

Các trình biên dịch chỉ hoạt động tốt nhưng khi tôi cố chạy tôi đã gặp phải vấn đề tiếp theo: lỗi CUDA tại file.cu:128 code = 35 (cudaErrorInsu enoughDriver) "cudaStreamCreate (& (stream [i]))"

Phiên bản nvcc của tôi:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2016 NVIDIA Corporation
Built on Tue_Jan_10_13:22:03_CST_2017
Cuda compilation tools, release 8.0, V8.0.61

Thông tin về card đồ họa:

lspci | egrep 'VGA|3D'
00:02.0 VGA compatible controller: Intel Corporation Skylake Integrated Graphics (rev 06)
02:00.0 3D controller: NVIDIA Corporation GM107M [GeForce GTX 960M] (rev a2)

Tôi cũng đã cài đặt VirtualGL, bumblebee-nvidia, primus, freeglut3-dev. Theo đây .

Khi tôi cố gắng chạy một cái gì đó trên ong nghệ, tôi đã nhận được điều này: optirun glxspheres64

[   41.413478] [ERROR]Cannot access secondary GPU - error: Could not load GPU driver
[   41.413520] [ERROR]Aborting because fallback start is disabled.

Trình điều khiển nvidia không hoạt động.

nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Có vẻ như phiên bản nvidia 375 được cài đặt nhưng tôi không thể làm cho nó hoạt động được.

whereis nvidia
nvidia: /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-375-375.66/nvidia

Và một số thông tin trình điều khiển.

modinfo nvidia_375
filename:       /lib/modules/4.8.0-54-generic/updates/dkms/nvidia_375.ko
alias:          char-major-195-*
version:        375.66
supported:      external
license:        NVIDIA
srcversion:     68751AFD79A210CEFFB8758
alias:          pci:v000010DEd00000E00sv*sd*bc04sc80i00*
alias:          pci:v000010DEd*sv*sd*bc03sc02i00*
alias:          pci:v000010DEd*sv*sd*bc03sc00i00*
depends:        
vermagic:       4.8.0-54-generic SMP mod_unload modversions 
parm:           NVreg_Mobile:int
parm:           NVreg_ResmanDebugLevel:int
parm:           NVreg_RmLogonRC:int
parm:           NVreg_ModifyDeviceFiles:int
parm:           NVreg_DeviceFileUID:int
parm:           NVreg_DeviceFileGID:int
parm:           NVreg_DeviceFileMode:int
parm:           NVreg_UpdateMemoryTypes:int
parm:           NVreg_InitializeSystemMemoryAllocations:int
parm:           NVreg_UsePageAttributeTable:int
parm:           NVreg_MapRegistersEarly:int
parm:           NVreg_RegisterForACPIEvents:int
parm:           NVreg_CheckPCIConfigSpace:int
parm:           NVreg_EnablePCIeGen3:int
parm:           NVreg_EnableMSI:int
parm:           NVreg_TCEBypassMode:int
parm:           NVreg_UseThreadedInterrupts:int
parm:           NVreg_MemoryPoolSize:int
parm:           NVreg_RegistryDwords:charp
parm:           NVreg_RmMsg:charp
parm:           NVreg_AssignGpus:charp

Tôi nghĩ rằng nó có thể là một số vấn đề phiên bản trình điều khiển:

dpkg -l | grep nvidia
ii  bumblebee-nvidia                            3.2.1-10                                      amd64        NVIDIA Optimus support using the proprietary NVIDIA driver
ii  nvidia-375                                  375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary driver - version 375.66
ii  nvidia-375-dev                              375.66-0ubuntu0.16.04.1                       amd64        NVIDIA binary Xorg driver development files
ii  nvidia-modprobe                             375.51-0ubuntu1                               amd64        Load the NVIDIA kernel driver and create device files
ii  nvidia-opencl-icd-375                       375.66-0ubuntu0.16.04.1                       amd64        NVIDIA OpenCL ICD
ii  nvidia-prime                                0.8.2                                         amd64        Tools to enable NVIDIA's Prime

Tôi đang thiếu gì?


Làm thế nào để bạn cài đặt trình điều khiển?
Charlie Parker

Đối mặt với cùng một lỗi, và không có câu trả lời nào hoạt động. Những gì đã làm là một đơn giản : $ reboot now.
darthbhyrava

Câu trả lời:


14

Nếu bạn nvidia-smikhông liên lạc được nhưng bạn đã cài đặt trình điều khiển rất nhiều lần, hãy kiểm tra prime-select.

  1. Chạy prime-select queryđể có được tất cả các tùy chọn có thể. Bạn nên xem ít nhất nvidia | intel.
  2. Chọn prime-select nvidia.
  3. Nếu nó nói nvidia is already selected, chọn một cái khác, ví dụ prime-select intel, sau đó quay lại nvidiaprime-select nvidia
  4. Khởi động lại và kiểm tra nvidia-smi.

Giúp tôi với. Cảm ơn!
Yaroslav Schubert

uh oh, prime-select querythậm chí không liệt kê intel, tôi đoán bây giờ tôi có 2 vấn đề ...
Inspi

11

Bạn có thể muốn cài đặt bộ công cụ cuda. Sử dụng lệnh sau để cài đặt nó.

sudo apt install nvidia-cuda-toolkit

Sau khi cài đặt xong, khởi động lại máy. nvidia-sminên làm việc.


làm việc cho tôi !!
x0v

Điều này làm việc cho tôi
Sundeep

5
Nó không hoạt động ở đây
Bill Kotsias

1
không làm điều này nếu bạn có cuda> = 10. Nó sẽ hạ cuda của bạn xuống 9, hiện đang có sẵn trên Ubuntu mà không có CUDA PPA.
loretoparisi

Làm sudo apt-get purge nvidia-*trước đó, sau đó dòng trên đã sửa mọi thứ liên quan đến CUDA cho tôi, đã cài đặt trình điều khiển 430 với CUDA 10.1
Dinari

5

Tôi đã tắt Secure Boot và nó hoạt động khá tốt.

@ que-smith đặt ra một câu hỏi khác cụ thể hơn để giải thích cách thực hiện, về cơ bản là một cấu hình thiết lập, nhưng anh ấy cũng viết một bài viết hay về cách làm điều đó ở đây .


2
Nó cũng giúp tôi với trình điều khiển nvidia 390! Tôi chưa bao giờ nghĩ rằng đó có thể là vì khởi động an toàn, thx :)
samutamm

Chế độ UEFI với Khởi động an toàn được kích hoạt đã được thực hiện ở đây. =) Có vẻ như nó không hoạt động cho tất cả mọi người, thật không may.
Renan Willian Prado

3

vì tôi không thể nhận xét về câu trả lời của @ Rodolfo ở trên (không đủ danh tiếng), tôi đang thêm một câu trả lời mới.

Trên máy của tôi, tôi phải cấu hình Secure Boot phù hợp với hệ điều hành của mình. Tôi có một bo mạch chính ASUS chạy Ubuntu 18.04 và đã thử cài đặt NVIDIA CUDA 10.1 Update 2 với trình điều khiển NVIDIA được đóng gói. Tôi đã đối mặt với vấn đề tương tự như mô tả ở trên. Khi nó bật ra, Secure Boot được đặt ở chế độ Windows UEFI. Thay đổi nó sang hệ điều hành khác đã sửa nó cho tôi.


1
Cảm ơn, tôi đã phải tắt tính năng Secure Boottự động kích hoạt lại trong quá trình cập nhật tự động Windows / BIOS !!! Bây giờ nvidia hoạt động tốt.
Bill Kotsias

bạn có phiền giải thích cách bạn thay đổi khởi động an toàn sang hệ điều hành khác không?
Inspi

1
@BillKotsias cảm ơn! : D
Marek

1

Dành cho độc giả tương lai:

Tôi đang sử dụng máy ảo (Google Cloud Platform)

và tôi đang theo ý chính này để cài đặt CudaCuDNntrên VM của tôi.

Tôi đã phải tự tải lên CuDNnmột phần. (Chỉ cần đưa nó ra khỏi đó.)

Bây giờ, nhận được lỗi:

Tôi đã có vấn đề này nhưng một khởi động lại hoàn toàn của ví dụ đã làm công việc. Và bằng cách khởi động lại hoàn toàn, tôi có nghĩa là dừng cá thể và bật lại.

Tôi hi vọng điêu nay se giup được ai đo.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.