Chinaunix
标题:
请教如何把>后面的id添加到每一列后面
[打印本页]
作者:
catloverat99
时间:
2015-10-30 14:55
标题:
请教如何把>后面的id添加到每一列后面
请教如何把>后面的id添加到每一列后面。文件格式如下:
>gg_diff/gg_ENSRNOG00000000017_1689_compare 2015-04-23 09:28:15.000000000 +0800
- V$AP2ALPHA_03 650
- V$AP2ALPHA_03 650
- V$CTCF_01 658
+ -V$AP2ALPHA_03 650
+ -V$AP2ALPHA_03 650
+ -V$CTCF_01 658
+ +V$CTCF_01 658
>gg_diff/gg_ENSRNOG00000000081_255_compare 2015-04-23 09:28:15.000000000 +0800
---V$SP1_Q6_01 82
---V$GLI_Q3 83
---V$ZFP161_04 84
---V$GKLF_Q4 85
---V$NANOG_01 85
--+V$NANOG_01 85
-+ V$SP1_Q6_01 82
-+ V$GLI_Q3 83
-+ V$ZFP161_04 84
希望得出的结果
>gg_diff/gg_ENSRNOG00000000017_1689_compare
- V$AP2ALPHA_03 650 ENSRNOG00000000017_1689
- V$AP2ALPHA_03 650 ENSRNOG00000000017_1689
- V$CTCF_01 658 ENSRNOG00000000017_1689
+ -V$AP2ALPHA_03 650 ENSRNOG00000000017_1689
......
>gg_diff/gg_ENSRNOG00000000081_255_compare
---V$SP1_Q6_01 82 ENSRNOG00000000081_255
---V$GLI_Q3 83 ENSRNOG00000000081_255
作者:
haooooaaa
时间:
2015-10-30 15:02
本帖最后由 haooooaaa 于 2015-10-30 15:04 编辑
awk '/^>/{split($1,t,"/");$0=$1}!/>/&&NF{$NF=$NF" "t[2]}1' file
复制代码
作者:
songyc_2015
时间:
2015-10-30 15:05
本帖最后由 songyc_2015 于 2015-10-30 15:14 编辑
awk '/>/{split($0,a,/_/);id=a[3]"_"a[4];print $1;next}{NF+=1;$NF=id}1' file
sed -r '/>/{s#[\t ]+.*##;h;s#.*_.*_(.*_.*)_.*#\1#;x};/>/!{G;s#\n# #}' file
作者:
catloverat99
时间:
2015-10-30 15:13
回复
2#
haooooaaa
好用!:)谢谢!
作者:
catloverat99
时间:
2015-10-30 15:15
回复
3#
songyc_2015
谢谢,跟我预期的结果一样:)
作者:
haooooaaa
时间:
2015-10-30 15:16
回复
4#
catloverat99
我才发现在似乎 ID 错了,没仔细看,
这样应该没问题,
awk -F_ -vOFS=_ '/>/{a=$3FS$4;NF--}!/>/&&NF{$NF=$NF" "a}1' file
复制代码
作者:
WilliBhamlll
时间:
2015-10-30 15:22
sed -r '/^>/{s/ .*//p;h;d};G;s#(.*)\n[^/]+/[^_]+_(.*)_.*#\1 \2#' file
复制代码
作者:
catloverat99
时间:
2015-10-30 15:24
回复
6#
haooooaaa
嗯嗯,这次的没问题:)
作者:
tc1989tc
时间:
2015-10-30 16:34
sed -n '/^>/{s/ \(.*\)//p;s/.*gg_\(.*\)_compare.*/\1/g;h;d};/^[^>]/G;s/\n/ /g;p' file1
复制代码
欢迎光临 Chinaunix (http://bbs.chinaunix.net/)
Powered by Discuz! X3.2