免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4150 | 回复: 8
打印 上一主题 下一主题

[文本处理] 打印关键字所在的列极其下一列 [复制链接]

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-10-29 11:34 |只看该作者 |倒序浏览
5可用积分
本帖最后由 mswsg 于 2014-10-29 15:36 编辑

文件格式如下
  1. S1        S2        S3        S4        S5        S6        S7        S8        S9        S10        S11
  2. BobWhite_c10098_535        AG        GG        GG        54        AA        1        TT        78        --        1
  3. BobWhite_c10173_317        AA        TT        AA        66        TT        67        --        1               
  4. BobWhite_c10173_316        AA        TT        TT        9        AA        107        --        1               
  5. BobWhite_c10098_536        AG        GG        GG        54        AA        1        TT        78        --        1
  6. BobWhite_c10109_234        CC        CC        CC        134                                               
  7. BobWhite_c10116_389        AA        AA        AA        134                                               
复制代码
打印第4-11列中同时含有 AA 和TT的列,极其对应的下一列(数字),并将前三列打印出来,
上述结果是
  1. BobWhite_c10098_535        AG        GG        AA        1        TT        78
  2. BobWhite_c10173_317        AA        TT        AA        66        TT        67
  3. BobWhite_c10173_316        AA        TT        TT        9        AA        107
  4. BobWhite_c10098_536        AG        GG        AA        1        TT        78
复制代码
2,3,4楼都正确,谢谢各位,最佳我给2楼了,谢谢

最佳答案

查看完整内容

回复 1# mswsg try:

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
2 [报告]
发表于 2014-10-29 11:34 |只看该作者
回复 1# mswsg

try:
  1. awk 'NR>1{s="";m=0;n=0;for(i=4;i<NF;i+=2){if($i=="AA"){s=s"\t"$i"\t"$(i+1);m=1}if($i=="TT"){s=s"\t"$i"\t"$(i+1);n=1}}if(m*n)print $1"\t"$2"\t"$3""s}' file
复制代码

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
3 [报告]
发表于 2014-10-29 12:29 |只看该作者
回复 1# mswsg
  1. awk '{for(i=4;i<=11;i++)if($i~/AA|TT/){n++;a[n]=i};if(n==2){printf $1 FS $2 FS $3 FS;for(i=a[1];i<=a[2];i++)printf $i FS;print $i};n="";delete a}'
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
4 [报告]
发表于 2014-10-29 14:05 |只看该作者
  1. [root@localhost ~]# awk -vOFS='\t' 'NR>1{for(i=4;i<NF;i+=2)if($i~/^AA|TT$/){n++}else{$i=$(i+1)=""}$0=$0;$1=$1;if(n==2)print;n=0}' i
  2. BobWhite_c10098_535        AG        GG        AA        1        TT        78
  3. BobWhite_c10173_317        AA        TT        AA        66        TT        67
  4. BobWhite_c10173_316        AA        TT        TT        9        AA        107
  5. BobWhite_c10098_536        AG        GG        AA        1        TT        78
  6. [root@localhost ~]#
复制代码

论坛徽章:
4
狮子座
日期:2014-04-17 10:45:47双鱼座
日期:2014-08-21 17:16:41处女座
日期:2014-08-26 13:46:46水瓶座
日期:2014-10-28 14:08:50
5 [报告]
发表于 2014-10-29 14:07 |只看该作者
本帖最后由 圣西罗门柱 于 2014-10-29 14:07 编辑

@ly5066113厉害

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
6 [报告]
发表于 2014-10-29 14:26 |只看该作者
你好,我的文件有8万多行,运行该命令后,结果是
  1. IAAV1913        TT        AA        AA        47        TT        79
  2. IAAV2130        TT        TT        AA        1        TT        112
  3. IAAV4618        TT        TT        AA        1        TT        105
复制代码
结果不对,但是运行上面的例子结果是正确的回复 2# ly5066113


   

论坛徽章:
4
程序设计版块每日发帖之星
日期:2015-10-14 06:20:00每日论坛发贴之星
日期:2015-10-14 06:20:00程序设计版块每日发帖之星
日期:2016-05-02 06:20:00程序设计版块每日发帖之星
日期:2016-05-08 06:20:00
7 [报告]
发表于 2014-10-29 14:46 |只看该作者
结果正确,我搞错了,对不起回复 2# ly5066113


   

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
8 [报告]
发表于 2016-04-28 22:33 |只看该作者
  1. sed -nr '/_/{s/^((\S+\s+){3}).*((AA\s+[0-9]+\s+).*(TT\s+[0-9]+)|(TT\s+[0-9]+\s+).*(AA\s+[0-9]+)).*/\1\4\5\6\7/p}'
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP