Tôi đã xây dựng Spark 1.4 từ bậc thầy phát triển GH và quá trình xây dựng diễn ra tốt đẹp. Nhưng khi tôi thực hiện, bin/pyspark
tôi nhận được phiên bản Python 2.7.9. Làm cách nào để thay đổi điều này?
Tôi đã xây dựng Spark 1.4 từ bậc thầy phát triển GH và quá trình xây dựng diễn ra tốt đẹp. Nhưng khi tôi thực hiện, bin/pyspark
tôi nhận được phiên bản Python 2.7.9. Làm cách nào để thay đổi điều này?
Câu trả lời:
Chỉ cần đặt biến môi trường:
export PYSPARK_PYTHON=python3
trong trường hợp bạn muốn đây là một thay đổi vĩnh viễn, hãy thêm dòng này vào tập lệnh pyspark.
export PYSPARK_PYTHON=python3.5
cho Python 3.5
$SPARK_HOME/conf/spark-env.sh
để spark-submit
sử dụng cùng một trình thông dịch.
PYSPARK_PYTHON=python3
./bin/pyspark
Nếu bạn muốn chạy trong IPython Notebook, hãy viết:
PYSPARK_PYTHON=python3
PYSPARK_DRIVER_PYTHON=ipython
PYSPARK_DRIVER_PYTHON_OPTS="notebook"
./bin/pyspark
Nếu python3
không thể truy cập được, bạn cần phải chuyển đường dẫn đến nó.
Hãy nhớ rằng tài liệu hiện tại (kể từ 1.4.1) đã vượt xa các hướng dẫn. May mắn thay, nó đã được vá .
Hãy xem hồ sơ. Dòng shebang có thể được trỏ đến nhị phân 'env' tìm kiếm đường dẫn cho tệp thực thi tương thích đầu tiên.
Bạn có thể thay đổi python thành python3. Thay đổi env để trực tiếp sử dụng mã nhị phân python3. Hoặc thực thi mã nhị phân trực tiếp với python3 và bỏ qua dòng shebang.
PYSPARK_PYTHON
biến môi trường.
Đối với Máy tính xách tay Jupyter, hãy chỉnh sửa spark-env.sh
tệp như được hiển thị bên dưới từ dòng lệnh
$ vi $SPARK_HOME/conf/spark-env.sh
Di chuyển đến cuối tệp và sao chép, dán những dòng này
export PYSPARK_PYTHON=python3
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS="notebook"
Sau đó, chỉ cần chạy lệnh sau để bắt đầu pyspark trong sổ ghi chép
$ pyspark
PYSPARK_DRIVER_PYTHON=ipython3 PYSPARK_DRIVER_PYTHON_OPTS="notebook" ./bin/pyspark
:, trong trường hợp đó nó chạy máy tính xách tay IPython 3.