Là nhanh hơn để tìm kiếm các cụm từ tìm kiếm dài hay ngắn? Hay nó ảnh hưởng đến tốc độ? Nói cách khác, bạn có nên làm cho thuật ngữ tìm kiếm càng chính xác càng tốt?
Có hơn 100 000 tệp và mỗi tệp chứa từ 20 đến hơn 5000 hàng dữ liệu. Thông thường grep được sử dụng để tìm chỉ một trường hợp của cụm từ tìm kiếm.
Giả sử thuật ngữ tìm kiếm là SEARCHTERM
và nó sẽ liên tiếp như thế này:
NAD+DP+1234567890:92++UNIQUE+NAME+SEARCHTERM++12345+FI'
Là nhanh hơn để tìm kiếm "TÌM KIẾM" hoặc "TÌM KIẾM"? Hãy nói rằng trong trường hợp này, chúng tôi không quan tâm nếu chúng tôi cũng tìm thấy kết quả khớp trong các dòng không liên quan khác.
Đây là cách tôi hiện đang làm điều đó:
grep NAD+DP 123* | grep SEARCHTERM
Nhưng tôi thấy nó khá chậm, vẫn còn. Thường mất khoảng 3-5 phút để tìm dữ liệu, ngay cả khi tôi biết tên tệp thô, giới hạn phạm vi trong khoảng 10 000 tệp.
Vì vậy, một thuật ngữ tìm kiếm dài hơn hoặc ngắn hơn sẽ giúp đỡ? Theo như tôi biết, grep tìm kiếm "khối" từ có độ dài nhất định?