Sau đây là ví dụ về một tệp lớn có tên AT5G60410.gff:
Chr5 TAIR10 gene 24294890 24301147 . + . ID=AT5G60410;Note=protein_coding_gene;Name=AT5G60410
Chr5 TAIR10 mRNA 24294890 24301147 . + . ID=AT5G60410.1;Parent=AT5G60410;Name=AT5G60410.1;Index=1
Chr5 TAIR10 protein 24295226 24300671 . + . ID=AT5G60410.1-Protein;Name=AT5G60410.1;Derives_from=AT5G60410.1
Chr5 TAIR10 exon 24294890 24295035 . + . Parent=AT5G60410.1
Chr5 TAIR10 five_prime_UTR 24294890 24295035 . + . Parent=AT5G60410.1
Chr5 TAIR10 exon 24295134 24295249 . + . Parent=AT5G60410.1
Chr5 TAIR10 five_prime_UTR 24295134 24295225 . + . Parent=AT5G60410.1
Chr5 TAIR10 CDS 24295226 24295249 . + 0 Parent=AT5G60410.1,AT5G60410.1-Protein;
Chr5 TAIR10 exon 24295518 24295598 . + . Parent=AT5G60410.1
Tôi đang gặp sự cố khi trích xuất các dòng cụ thể từ tệp này bằng grep. Tôi muốn trích xuất tất cả các dòng thuộc loại "gen" hoặc loại "exon", được chỉ định trong cột thứ ba. Tôi đã rất ngạc nhiên khi điều này không hoạt động:
grep 'gene|exon' AT5G60410.gff
Không có kết quả nào được trả lại. Tôi đã sai ở đâu?
egrep
thay thế.