Xử lý dữ liệu tăng tốc GPU cho R trong Windows


11

Tôi hiện đang lấy một bài báo về Dữ liệu lớn, trong đó chúng tôi sử dụng R rất nhiều để phân tích dữ liệu. Tôi tình cờ có GTX1070 trong máy tính vì lý do chơi game. Vì vậy, tôi nghĩ sẽ thật tuyệt nếu tôi có thể sử dụng nó để tăng tốc một số xử lý cho một số công việc mà các giảng viên của tôi đã làm cho tôi, nhưng thực sự không dễ để làm điều này cả. Tôi đã cài đặt gpuR, CUDA, Rtools, và một vài bit và bobs khác và tôi có thể lấy nó để tạo các đối tượng gpuMatrix từ dữ liệu biểu hiện genomic, nhưng tôi vẫn chưa tìm thấy một chức năng nào hoạt động với các đối tượng gpuMatrix và cũng cung cấp bất kỳ sự khác biệt đáng chú ý trong hiệu suất. Có lẽ điều này chỉ liên quan đến những hạn chế vốn có của gói gpuR - một số gói khác dường như nói về việc có các chức năng nghe có vẻ giống như thứ mà tôi đang tìm kiếm,

Hầu như tất cả các gói đó là dành riêng cho Linux, có khó để thực hiện hỗ trợ GPU cho R trong windows không? Hoặc có một số lý do khác mà có rất ít gói có sẵn để làm điều này trong Windows? Ở một khía cạnh nào đó tôi chỉ tò mò, nhưng cũng thật tuyệt khi thực sự làm cho nó hoạt động. Điều làm tôi ngạc nhiên là có rất ít có sẵn cho Windows, thường là theo cách khác.


1
Tôi đã thấy tính toán GPU trong Windows là một thách thức, bất kể ngôn ngữ lập trình. Các công cụ này có xu hướng được phát triển trong Linux hoặc OS X. Bạn có thể dùng thử hệ thống khởi động kép với Linux Mint Cinnamon (bản phân phối ưa thích của tôi tại thời điểm này, vì mọi thứ chỉ hoạt động).
Adrian Keister

Câu trả lời:


4

Theo kinh nghiệm của tôi, việc thiết lập xử lý GPU cho R rất khó, thiết lập nó trên máy Windows thậm chí còn khó hơn. Ngoài ra, xử lý GPU chỉ có thể được sử dụng cho các loại tính toán rất cụ thể.

Nếu bạn chỉ muốn thiết lập xử lý GPU vì lợi ích của nó, thì câu trả lời của tôi là khá vô ích.

Tuy nhiên, nếu bạn quan tâm đến việc tối ưu hóa hiệu suất chung của hệ thống và mã của bạn, tôi khuyên bạn nên kiểm tra các bước sau:

  • Sử dụng Microsoft R Open thay vì Base R vì nó tự động cho phép xử lý đa lõi trên máy của bạn.

  • Vectorize mã của bạn

  • Sử dụng các thư viện như data.table thay vì dataframes

  • Tránh trồng cây

Nói chung, hiệu suất của R phụ thuộc mạnh mẽ vào chất lượng mã của bạn. Một bản tóm tắt rất hay về những gì bạn có thể và nên làm được cung cấp trong R Inferno bởi Patrick Burns.


Cảm ơn các bình luận. tôi đã thay đổi câu trả lời tương ứng
jd1338

Sau đó bình luận của tôi không còn hữu ích.
42-
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.