Tôi có hai tập tin, hãy gọi cho họ 123.txt
và 789.txt
. 123.txt
dài 2,5 triệu dòng và dài 789.txt
65 triệu dòng. Có cách nào để sử dụng grep
hoặc tương tự để giữ bất kỳ dòng 789.txt
nào có chứa các dòng từ123.txt?
Sẽ có tối đa một bản sao trên mỗi dòng 789.txt
và văn bản trùng lặp sẽ ở đầu dòng. Tôi hoàn toàn bế tắc về điều này và không thể tìm thấy bất kỳ thông tin nào trên mạng, vì vậy tôi thực sự không có gì để bắt đầu. Nó sẽ chạy trên một máy chủ, vì vậy tôi không ngại mất một lúc (mà tôi biết nó sẽ)
123.txt:
hxxp://www.a.com hxxp://www.b.com hxxp://www.c.com
789.txt:
hxxp://www.a.com/kgjdk-jgjg/ hxxp://www.b.com/gsjahk123/ hxxp://www.c.com/abc.txt hxxp://www.d.com/sahgsj/
Sản phẩm chất lượng:
hxxp://www.a.com/kgjdk-jgjg/ hxxp://www.b.com/gsjahk123/ hxxp://www.c.com/abc.txt
123.txt
không xuất hiện789.txt
cũng như các dòng trong789.txt
đó123.txt
(chúng sẽ chỉ được in một lần, nhưng dù sao cũng được in).