Tôi muốn tìm các mẫu được liệt kê trong một tệp và tìm thấy chúng trong tệp khác. Tệp thứ hai có các mẫu được phân tách bằng dấu phẩy.
ví dụ tập tin đầu tiên F1 có gen
ENSG00000187546
ENSG00000113492
ENSG00000166971
và tệp thứ hai F2 có các gen đó cùng với một số cột khác (năm cột) mà tôi cần
region gene chromosome start end
intronic ENSG00000135870 1 173921301 173921301
intergenic ENSG00000166971(dist=56181),ENSG00000103494(dist=37091) 16 53594504 53594504
ncRNA_intronic ENSG00000215231 5 5039185 5039185
intronic ENSG00000157890 15 66353740 66353740
Vì vậy, gen ENSG00000166971 có trong tệp thứ hai không hiển thị trong grep vì nó có một gen khác với nó, được phân tách bằng dấu phẩy.
Mã của tôi là:
grep -f "F1.txt" "F2.txt" >output.txt
Tôi muốn những giá trị đó ngay cả khi một trong số chúng có mặt và dữ liệu liên quan với nó. Có cách nào để làm điều này không?
grep
neo các mẫu của nó theo mặc định? Cógrep -f <(echo a) <(echo 'a,b')
sản xuất bất kỳ đầu ra?