Trong trường hợp của Java:
Nếu chúng ta sử dụng DataFrames
, trong khi áp dụng các phép nối (ở đây là phép nối trong), chúng ta có thể sắp xếp (theo ASC) sau khi chọn các phần tử riêng biệt trong mỗi DF như:
Dataset<Row> d1 = e_data.distinct().join(s_data.distinct(), "e_id").orderBy("salary");
nơi e_id
là cột mà tham gia được áp dụng khi được sắp xếp theo mức lương trong ASC.
Ngoài ra, chúng ta có thể sử dụng Spark SQL như:
SQLContext sqlCtx = spark.sqlContext();
sqlCtx.sql("select * from global_temp.salary order by salary desc").show();
Ở đâu
- tia lửa -> SparkSession
- lương -> Chế độ xem toàn cầu.