Tôi có một ứng dụng phát trực tuyến tia lửa tạo ra một tập dữ liệu cho mỗi phút. Tôi cần lưu / ghi đè kết quả của dữ liệu đã xử lý.
Khi tôi cố gắng ghi đè tập dữ liệu org.apache.hadoop.mapred.FileAlreadyExistsException ngừng thực thi.
Tôi đặt thuộc tính Spark set("spark.files.overwrite","true")
, nhưng không có may mắn.
Làm cách nào để ghi đè hoặc Xóa trước các tệp khỏi tia lửa?
set("spark.files.overwrite","true")
chỉ hoạt động cho các tệp được thêm vàospark.addFile()