Tôi đã cài đặt OpenJDK 13.0.1 và python 3.8 và spark 2.4.4. Hướng dẫn để kiểm tra cài đặt là chạy. \ Bin \ pyspark từ thư mục gốc của cài đặt tia lửa. Tôi không chắc chắn nếu tôi bỏ lỡ một bước trong cài đặt tia lửa, như đặt một số biến môi trường, nhưng tôi không thể tìm thấy bất kỳ hướng dẫn chi tiết nào nữa.
Tôi có thể chạy trình thông dịch python trên máy của mình, vì vậy tôi tự tin rằng nó được cài đặt chính xác và chạy "java -version" mang lại cho tôi phản hồi mong đợi, vì vậy tôi không nghĩ vấn đề xảy ra với một trong hai.
Tôi nhận được một dấu vết lỗi từ đám mây trên trang web:
Traceback (most recent call last):
File "C:\software\spark-2.4.4-bin-hadoop2.7\bin\..\python\pyspark\shell.py", line 31, in <module>
from pyspark import SparkConf
File "C:\software\spark-2.4.4-bin-hadoop2.7\python\pyspark\__init__.py", line 51, in <module>
from pyspark.context import SparkContext
File "C:\software\spark-2.4.4-bin-hadoop2.7\python\pyspark\context.py", line 31, in <module>
from pyspark import accumulators
File "C:\software\spark-2.4.4-bin-hadoop2.7\python\pyspark\accumulators.py", line 97, in <module>
from pyspark.serializers import read_int, PickleSerializer
File "C:\software\spark-2.4.4-bin-hadoop2.7\python\pyspark\serializers.py", line 71, in <module>
from pyspark import cloudpickle
File "C:\software\spark-2.4.4-bin-hadoop2.7\python\pyspark\cloudpickle.py", line 145, in <module>
_cell_set_template_code = _make_cell_set_template_code()
File "C:\software\spark-2.4.4-bin-hadoop2.7\python\pyspark\cloudpickle.py", line 126, in _make_cell_set_template_code
return types.CodeType(
TypeError: an integer is required (got type bytes)