Chinaunix

标题: 请教如何把>后面的id添加到每一列后面 [打印本页]

作者: catloverat99    时间: 2015-10-30 14:55
标题: 请教如何把>后面的id添加到每一列后面
请教如何把>后面的id添加到每一列后面。文件格式如下:

>gg_diff/gg_ENSRNOG00000000017_1689_compare        2015-04-23 09:28:15.000000000 +0800
-  V$AP2ALPHA_03 650
-  V$AP2ALPHA_03 650
-  V$CTCF_01 658
+ -V$AP2ALPHA_03 650
+ -V$AP2ALPHA_03 650
+ -V$CTCF_01 658
+ +V$CTCF_01 658
>gg_diff/gg_ENSRNOG00000000081_255_compare        2015-04-23 09:28:15.000000000 +0800
---V$SP1_Q6_01 82
---V$GLI_Q3 83
---V$ZFP161_04 84
---V$GKLF_Q4 85
---V$NANOG_01 85
--+V$NANOG_01 85
-+ V$SP1_Q6_01 82
-+ V$GLI_Q3 83
-+ V$ZFP161_04 84

希望得出的结果
>gg_diff/gg_ENSRNOG00000000017_1689_compare
-  V$AP2ALPHA_03 650 ENSRNOG00000000017_1689
-  V$AP2ALPHA_03 650 ENSRNOG00000000017_1689
-  V$CTCF_01 658 ENSRNOG00000000017_1689
+ -V$AP2ALPHA_03 650 ENSRNOG00000000017_1689
......
>gg_diff/gg_ENSRNOG00000000081_255_compare
---V$SP1_Q6_01 82 ENSRNOG00000000081_255
---V$GLI_Q3 83 ENSRNOG00000000081_255
作者: haooooaaa    时间: 2015-10-30 15:02
本帖最后由 haooooaaa 于 2015-10-30 15:04 编辑
  1. awk '/^>/{split($1,t,"/");$0=$1}!/>/&&NF{$NF=$NF" "t[2]}1'  file
复制代码

作者: songyc_2015    时间: 2015-10-30 15:05
本帖最后由 songyc_2015 于 2015-10-30 15:14 编辑

awk '/>/{split($0,a,/_/);id=a[3]"_"a[4];print $1;next}{NF+=1;$NF=id}1' file
sed -r '/>/{s#[\t ]+.*##;h;s#.*_.*_(.*_.*)_.*#\1#;x};/>/!{G;s#\n# #}' file
作者: catloverat99    时间: 2015-10-30 15:13
回复 2# haooooaaa

好用!:)谢谢!


   
作者: catloverat99    时间: 2015-10-30 15:15
回复 3# songyc_2015

谢谢,跟我预期的结果一样:)


   
作者: haooooaaa    时间: 2015-10-30 15:16
回复 4# catloverat99


    我才发现在似乎 ID 错了,没仔细看,


这样应该没问题,
  1. awk -F_ -vOFS=_ '/>/{a=$3FS$4;NF--}!/>/&&NF{$NF=$NF" "a}1'  file
复制代码

作者: WilliBhamlll    时间: 2015-10-30 15:22
  1. sed -r '/^>/{s/ .*//p;h;d};G;s#(.*)\n[^/]+/[^_]+_(.*)_.*#\1 \2#' file
复制代码

作者: catloverat99    时间: 2015-10-30 15:24
回复 6# haooooaaa

嗯嗯,这次的没问题:)


   
作者: tc1989tc    时间: 2015-10-30 16:34
  1. sed -n '/^>/{s/ \(.*\)//p;s/.*gg_\(.*\)_compare.*/\1/g;h;d};/^[^>]/G;s/\n/ /g;p' file1
复制代码





欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2