免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1609 | 回复: 8
打印 上一主题 下一主题

[文本处理] 请教如何把>后面的id添加到每一列后面 [复制链接]

论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-10-29 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-10-30 14:55 |只看该作者 |倒序浏览
请教如何把>后面的id添加到每一列后面。文件格式如下:

>gg_diff/gg_ENSRNOG00000000017_1689_compare        2015-04-23 09:28:15.000000000 +0800
-  V$AP2ALPHA_03 650
-  V$AP2ALPHA_03 650
-  V$CTCF_01 658
+ -V$AP2ALPHA_03 650
+ -V$AP2ALPHA_03 650
+ -V$CTCF_01 658
+ +V$CTCF_01 658
>gg_diff/gg_ENSRNOG00000000081_255_compare        2015-04-23 09:28:15.000000000 +0800
---V$SP1_Q6_01 82
---V$GLI_Q3 83
---V$ZFP161_04 84
---V$GKLF_Q4 85
---V$NANOG_01 85
--+V$NANOG_01 85
-+ V$SP1_Q6_01 82
-+ V$GLI_Q3 83
-+ V$ZFP161_04 84

希望得出的结果
>gg_diff/gg_ENSRNOG00000000017_1689_compare
-  V$AP2ALPHA_03 650 ENSRNOG00000000017_1689
-  V$AP2ALPHA_03 650 ENSRNOG00000000017_1689
-  V$CTCF_01 658 ENSRNOG00000000017_1689
+ -V$AP2ALPHA_03 650 ENSRNOG00000000017_1689
......
>gg_diff/gg_ENSRNOG00000000081_255_compare
---V$SP1_Q6_01 82 ENSRNOG00000000081_255
---V$GLI_Q3 83 ENSRNOG00000000081_255

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
2 [报告]
发表于 2015-10-30 15:02 |只看该作者
本帖最后由 haooooaaa 于 2015-10-30 15:04 编辑
  1. awk '/^>/{split($1,t,"/");$0=$1}!/>/&&NF{$NF=$NF" "t[2]}1'  file
复制代码

论坛徽章:
20
卯兔
日期:2015-01-26 22:05:142015亚冠之萨济拖拉机
日期:2015-09-10 15:15:282015亚冠之阿尔希拉尔
日期:2015-09-25 17:37:53程序设计版块每日发帖之星
日期:2015-10-03 06:20:00程序设计版块每日发帖之星
日期:2015-12-09 06:20:00CU十四周年纪念徽章
日期:2015-12-17 09:07:15程序设计版块每日发帖之星
日期:2015-12-25 06:20:34程序设计版块每日发帖之星
日期:2015-12-25 06:20:34程序设计版块每日发帖之星
日期:2015-12-25 06:20:342015亚冠之广州富力
日期:2015-08-27 19:29:56每日论坛发贴之星
日期:2015-08-26 06:20:002015亚冠之阿尔希拉尔
日期:2015-05-18 17:26:27
3 [报告]
发表于 2015-10-30 15:05 |只看该作者
本帖最后由 songyc_2015 于 2015-10-30 15:14 编辑

awk '/>/{split($0,a,/_/);id=a[3]"_"a[4];print $1;next}{NF+=1;$NF=id}1' file
sed -r '/>/{s#[\t ]+.*##;h;s#.*_.*_(.*_.*)_.*#\1#;x};/>/!{G;s#\n# #}' file

评分

参与人数 1信誉积分 +5 收起 理由
catloverat99 + 5 很给力!

查看全部评分

论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-10-29 06:20:00
4 [报告]
发表于 2015-10-30 15:13 |只看该作者
回复 2# haooooaaa

好用!:)谢谢!


   

论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-10-29 06:20:00
5 [报告]
发表于 2015-10-30 15:15 |只看该作者
回复 3# songyc_2015

谢谢,跟我预期的结果一样:)


   

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
6 [报告]
发表于 2015-10-30 15:16 |只看该作者
回复 4# catloverat99


    我才发现在似乎 ID 错了,没仔细看,


这样应该没问题,
  1. awk -F_ -vOFS=_ '/>/{a=$3FS$4;NF--}!/>/&&NF{$NF=$NF" "a}1'  file
复制代码

评分

参与人数 1信誉积分 +5 收起 理由
catloverat99 + 5 很给力!

查看全部评分

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
7 [报告]
发表于 2015-10-30 15:22 |只看该作者
  1. sed -r '/^>/{s/ .*//p;h;d};G;s#(.*)\n[^/]+/[^_]+_(.*)_.*#\1 \2#' file
复制代码

论坛徽章:
1
程序设计版块每日发帖之星
日期:2015-10-29 06:20:00
8 [报告]
发表于 2015-10-30 15:24 |只看该作者
回复 6# haooooaaa

嗯嗯,这次的没问题:)


   

论坛徽章:
16
CU十二周年纪念徽章
日期:2013-10-24 15:41:3415-16赛季CBA联赛之广东
日期:2015-12-23 21:21:55青铜圣斗士
日期:2015-12-05 10:35:30黄金圣斗士
日期:2015-11-26 20:42:16神斗士
日期:2015-11-19 12:47:50每日论坛发贴之星
日期:2015-11-18 06:20:00程序设计版块每日发帖之星
日期:2015-11-18 06:20:002015亚冠之城南
日期:2015-11-10 19:10:492015亚冠之萨济拖拉机
日期:2015-10-28 18:47:282015亚冠之柏太阳神
日期:2015-08-30 17:21:492015亚冠之山东鲁能
日期:2015-07-07 18:48:39摩羯座
日期:2014-08-29 23:01:42
9 [报告]
发表于 2015-10-30 16:34 |只看该作者
  1. sed -n '/^>/{s/ \(.*\)//p;s/.*gg_\(.*\)_compare.*/\1/g;h;d};/^[^>]/G;s/\n/ /g;p' file1
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP