- 论坛徽章:
- 60
|
本帖最后由 reyleon 于 2013-08-27 15:45 编辑
回复 12# iamline
针对这种情况(注:是10列,并不是9列):- C1 T10 exon 3867739 3868443 . - . gene_id "AT1G11482.1";
- C1 T10 exon 3868592 3868649 . - . gene_id "AT1G11482.1";
- C1 T10 exon 3868799 3868870 . - . gene_id "AT1G11482.1";
- C1 T10 exon 3868884 3869527 . - . gene_id "AT1G11490.1";
- C1 T10 exon 3869612 3870065 . - . gene_id "AT1G11490.1";
- C1 T10 CDS 3868884 3869527 . - 2 gene_id "AT1G11490.1";
- C1 T10 CDS 3869612 3870065 . - 0 gene_id "AT1G11490.1";
复制代码 也就是说,$1,$4,$5,$10 如果有重复的就不修改是吗?! 如果是的话,也是大同小异的命令:- awk 'BEGIN{OFS="\t"}NR==FNR{a[$1,$4,$5,$10]++;next}NF+=0{if(a[$1,$4,$5,$10]==1&&$3=="exon")$7="+"}1' file file
复制代码 |
|