Tôi có một ứng dụng phát trực tuyến tia lửa tạo ra một tập dữ liệu cho mỗi phút. Tôi cần lưu / ghi đè kết quả của dữ liệu đã xử lý.
Khi tôi cố gắng ghi đè tập dữ liệu org.apache.hadoop.mapred.FileAlreadyExistsException ngừng thực thi.
Tôi đặt thuộc tính Spark set("spark.files.overwrite","true"), nhưng không có may mắn.
Làm cách nào để ghi đè hoặc Xóa trước các tệp khỏi tia lửa?
set("spark.files.overwrite","true")chỉ hoạt động cho các tệp được thêm vàospark.addFile()