Có tiện ích nào giống grep
hoặc thậm chí uniq
nhưng đối với tìm kiếm không chính xác, hoặc tôi nên tự viết nó?
Tôi có nghĩa là nó sẽ xem xét 90% (số có thể thay đổi) phù hợp, hoặc một cái gì đó tương tự. Ví dụ: tôi có tệp có nhiều chuỗi:
abc123
abd123
abc223
qwe938
Trong trường hợp này, tiện ích như vậy sẽ trả về ba chuỗi đầu tiên hoặc nói rằng chúng tương tự nhau. Tất nhiên tôi không biết bất kỳ mẫu nội dung nào của tệp như trong trường hợp có grep
hoặc uniq
.
Đây là bộ dữ liệu rất cụ thể. Chẳng hạn, Mary giống Marie, hay ABC giống BCD? Bạn có thể đưa ra một ví dụ thực tế về dữ liệu của bạn?
—
EightBitTony