Tôi có file1 như thế này:
CHR SNP TEST A1 A2 GENO O(HET) E(HET) P
0 AFFX-SNP-000541 ALL 0 0 0/0/0 nan nan 1
0 AFFX-SNP-000541 AFF 0 0 0/0/0 nan nan NA
0 AFFX-SNP-000541 UNAFF 0 0 0/0/0 nan nan NA
0 AFFX-SNP-002255 ALL 0 0 0/0/0 nan nan 1
0 AFFX-SNP-002255 AFF 0 0 0/0/0 nan nan NA
0 AFFX-SNP-002255 UNAFF 0 0 0/0/0 nan nan NA
1 rs12103 ALL C T 55/250/317 0.4019 0.4113 0.5596
1 rs12103 AFF C T 0/0/0 nan nan NA
1 rs12103 UNAFF C T 0/0/0 nan nan NA
1 rs12103_1247494 ALL C T 55/250/321 0.3994 0.4097 0.5581
1 rs12103_1247494 AFF C T 0/0/0 nan nan NA
1 rs12103_1247494 UNAFF C T 0/0/0 nan nan NA
Và file2 như:
CHR SNP A1 A2 MAF NCHROBS
0 AFFX-SNP-000541 0 0 NA 0
0 AFFX-SNP-002255 0 0 NA 0
1 rs12103 C T 0.2894 1244
1 rs12103_1247494 C T 0.2875 1252
Tôi muốn hợp nhất file2 với file1 dựa trên tên SNP và TEST == ALL và giữ CHR, SNP, P và MAF trong tệp đầu ra3. Có ai biết cách tốt nhất cho shell đó (Unix) không?
Một đầu ra mong muốn sẽ là:
CHR SNP MAF P
0 AFFX-SNP-000541 NA 1
0 AFFX-SNP-002255 NA 1
1 rs12103 0.2894 0.5596
1 rs12103_1247494 0.2875 0.5581