Tôi có một tập hợp các tệp văn bản lớn và đang phát triển, tất cả đều khá nhỏ (dưới 100 byte). Tôi muốn khác nhau từng cặp tệp có thể và lưu ý đó là trùng lặp. Tôi có thể viết một tập lệnh Python để làm điều này, nhưng tôi tự hỏi liệu có một công cụ dòng lệnh Linux hiện có (hoặc có lẽ là một sự kết hợp đơn giản của các công cụ) sẽ làm điều này không?
Cập nhật (để phản hồi bình luận của mfinni ): Các tệp đều nằm trong một thư mục, vì vậy tất cả chúng đều có tên tệp khác nhau. (Nhưng tất cả chúng đều có một phần mở rộng tên tệp chung, giúp dễ dàng chọn tất cả chúng bằng ký tự đại diện.)