Tôi có một tệp lớn ở định dạng sau:
2 1019 0 12
2 1019 3 0
2 1021 0 2
2 1021 2 0
2 1022 4 5
2 1030 0 1
2 1030 5 0
2 1031 4 4
Nếu các giá trị trong cột 2 khớp nhau, tôi muốn tính tổng các giá trị trong cột 3 và 4 của cả hai dòng, ngoài ra chỉ là tổng của các giá trị trong dòng duy nhất.
Vì vậy, đầu ra tôi hy vọng sẽ trông như thế này:
2 1019 15
2 1021 4
2 1022 9
2 1030 6
2 1031 8
Tôi có thể sắp xếp các tệp theo cột 2 bằng awk
hoặc sort
tính tổng các cột cuối cùng awk
, nhưng chỉ cho các dòng riêng lẻ không dành cho hai dòng có cột 2 khớp.
$1 $2
chìa khóa.