Tôi có một chuỗi các url rất dài không có ký tự phân tách, có cùng định dạng như dưới đây:
http://example.comhttp://example.nethttp://example.orghttp://etc...
Tôi muốn mỗi URL nằm trên một dòng mới. Tôi đã cố gắng thực hiện điều này bằng cách thay thế tất cả các phiên bản của "http: //" bằng "\ nhttp: //" bằng cách sử dụng sed
sed 's_http://_\nhttp://_g' urls.txt
nhưng xảy ra lỗi phân đoạn (vi phạm bộ nhớ). Tôi chỉ có thể phỏng đoán rằng kích thước tuyệt đối của tệp (trên 100 GB) đang khiến sed vượt quá giới hạn.
Tôi có thể chia tệp thành nhiều tệp nhỏ hơn để xử lý, nhưng tất cả các phiên bản của "http: //" sẽ cần được giữ nguyên.
Có cách nào tốt hơn để làm điều này?