Tôi gặp vấn đề tương tự trên tia lửa độc lập trong cửa sổ . Phiên bản sửa lỗi của tôi là như thế này: Tôi đã cài đặt các biến môi trường của mình như sau
PYSPARK_SUBMIT_ARGS="pyspark-shell"
PYSPARK_DRIVER_PYTHON=jupyter
PYSPARK_DRIVER_PYTHON_OPTS='notebook' pyspark
Với cài đặt này, tôi đã thực hiện một Hành động trên pyspark và có ngoại lệ sau:
Python in worker has different version 3.6 than that in driver 3.5, PySpark cannot run with different minor versions.
Please check environment variables PYSPARK_PYTHON and PYSPARK_DRIVER_PYTHON are correctly set.
Để kiểm tra phiên bản python nào mà spark-worker của tôi đang sử dụng, hãy nhấn vào phần sau trong lời nhắc cmd .
python --version
Python 3.6.3
đã cho tôi thấy Python 3.6.3 . Vì vậy, rõ ràng là spark-worker của tôi đang sử dụng hệ thống python v3.6.3.
Bây giờ khi tôi đặt trình điều khiển tia lửa của mình để chạy jupyter bằng cách cài đặt, PYSPARK_DRIVER_PYTHON=jupyter
vì vậy tôi cần kiểm tra phiên bản python mà jupyter đang sử dụng.
Để làm điều này, hãy mở Anaconda Prompt và nhấn
python --version
Python 3.5.X :: Anaconda, Inc.
Ở đây có những trăn jupyter đang sử dụng v3.5.x . Bạn cũng có thể kiểm tra phiên bản này trong bất kỳ Notebook nào (Trợ giúp-> Giới thiệu).
Bây giờ tôi cần cập nhật jupyter python lên phiên bản v3.6.6 . Để làm điều đó, hãy mở Anaconda Prompt và nhấn
tìm kiếm conda python
Điều này sẽ cung cấp cho bạn danh sách các phiên bản python có sẵn trong Anaconda. Cài đặt cái mà bạn mong muốn với
conda cài đặt python = 3.6.3
Bây giờ tôi có cả hai bản cài đặt Python của cùng một phiên bản 3.6.3 Spark không nên tuân thủ và nó không tuân theo khi tôi chạy một Hành động trên trình điều khiển Spark. Ngoại lệ không còn nữa. Chúc bạn viết mã vui vẻ ...