Tôi có tài liệu tham khảo của mình dưới dạng tệp văn bản với một danh sách dài các mục và mỗi mục có hai (hoặc nhiều) trường.
Cột đầu tiên là url của tài liệu tham khảo; cột thứ hai là tiêu đề có thể thay đổi một chút tùy thuộc vào cách thực hiện mục nhập. Tương tự cho trường thứ ba có thể có hoặc không có mặt.
Tôi muốn xác định nhưng không xóa các mục có trường đầu tiên (url tham chiếu) giống hệt nhau. Tôi biết sort -k1,1 -u
nhưng điều đó sẽ tự động (không tương tác) loại bỏ tất cả trừ lần truy cập đầu tiên. Có cách nào để chỉ cho tôi biết để tôi có thể chọn giữ lại không?
Trong trích xuất bên dưới của ba dòng có cùng trường đầu tiên ( http://unix.stackexchange.com/questions/49569/
), tôi muốn giữ dòng 2 vì nó có các thẻ bổ sung (sort, CLI) và xóa các dòng # 1 và # 3:
http://unix.stackexchange.com/questions/49569/ unique-lines-based-on-the-first-field
http://unix.stackexchange.com/questions/49569/ Unique lines based on the first field sort, CLI
http://unix.stackexchange.com/questions/49569/ Unique lines based on the first field
Có chương trình nào giúp xác định những "bản sao" như vậy không? Sau đó, tôi có thể tự dọn dẹp bằng cách xóa cá nhân các dòng # 1 và # 3 không?