1
Apache Spark: tác động của việc phân vùng lại, sắp xếp và lưu vào bộ nhớ cache khi tham gia
Tôi đang khám phá hành vi của Spark khi tham gia một bảng vào chính nó. Tôi đang sử dụng Databricks. Kịch bản giả của tôi là: Đọc bảng bên ngoài dưới dạng dataframe A (các tệp cơ bản ở định dạng delta) Xác định khung dữ liệu B là …