Tôi có một tệp văn bản dài (một tệp tab cho trình soạn thảo stardict) bao gồm các dòng theo định dạng sau:
word1 some text
word1 some other text
word2 more text
word3 even more
và muốn chuyển đổi nó thành
word1 some text<br>some other text
word2 more text
word3 even more
Điều này có nghĩa là các dòng tiếp theo (tệp được sắp xếp) bắt đầu bằng cùng một từ nên được hợp nhất với một từ duy nhất (ở đây các định nghĩa được phân tách bằng <br>
). Các dòng có khởi đầu bằng nhau cũng có thể xuất hiện thường xuyên hơn chỉ hai lần. Ký tự phân tách từ và định nghĩa là ký tự tab và là duy nhất trên mỗi dòng. word1
, word2
, word3
Là của placeholders khóa học cho một cái gì đó tùy ý (trừ tab và ký tự xuống dòng) mà tôi không biết trước.
Tôi có thể nghĩ về một đoạn mã Perl dài hơn để thực hiện điều này, nhưng tự hỏi liệu có một giải pháp ngắn nào trong Perl hoặc một cái gì đó cho dòng lệnh. Có ý kiến gì không?