免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2903 | 回复: 15
打印 上一主题 下一主题

[文本处理] awk字符串截取的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-07-08 17:18 |只看该作者 |倒序浏览
我有如下内容

姓名                 出货数量(件)

张三(1)            2
张三(2)            3
王二麻子(3)      4
王二麻子(4)      4

括号内的数字本是用于区分不同出货时间的,现在需要把相同姓名的出货量合并求和,名称去掉括号中的数并且只显示一次,达到如下效果

姓名                出货数量

张三                    5
王二麻子              8‘


请各位支招!

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
2 [报告]
发表于 2013-07-08 17:24 |只看该作者
  1. awk -F ' |\\(' '{a[$1]+=$NF}END{for(i in a)print i,a[i]}'
复制代码

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
3 [报告]
发表于 2013-07-08 17:30 |只看该作者
  1. [WilliBhamlll@CC ~]$ awk 'NR<3{print;next}{a[gensub(/(.*)/,"","1",$1)]+=$2}END{for(i in a)print i,a[i]}' file
  2. 姓名                 出货数量(件)

  3. 王二麻子 8
  4. 张三 5
复制代码

论坛徽章:
0
4 [报告]
发表于 2013-07-08 23:15 |只看该作者
本帖最后由 hqw19881118 于 2013-07-08 23:16 编辑

初次学习,给个最笨笨的办法吧:
  1. cat file | sed 's/([0-9]*)//g'|\
  2.         awk '{
  3.                     if($2 !~ /[0-9][0-9]*/){
  4.                         print $0;
  5.                     }else{
  6.                         a[$1]+=$2
  7.                     }
  8.                 }
  9.                 END{for(i in a)
  10.                     printf "%s\t%s\n",i,a[i]
  11.                     }'
复制代码

论坛徽章:
0
5 [报告]
发表于 2013-07-09 09:11 |只看该作者
大神能否给个注释,新手表示难以理解啊!谢谢!回复 2# 关阴月飞


   

论坛徽章:
0
6 [报告]
发表于 2013-07-09 09:15 |只看该作者
谢谢指导!但是我运行出来的结果和源文件一样没有变化啊?求大神给个注释吧!回复 3# WilliBhamlll


   

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
7 [报告]
发表于 2013-07-09 09:21 |只看该作者
本帖最后由 WilliBhamlll 于 2013-07-09 09:21 编辑

回复 6# 88626285

可以把你的源文件上传上来看看吗?
   

论坛徽章:
0
8 [报告]
发表于 2013-07-09 09:29 |只看该作者
不能上传txt文件,就是把一楼的数据放在txt里面就好了回复 7# WilliBhamlll


   

论坛徽章:
50
15-16赛季CBA联赛之广夏
日期:2018-11-05 09:42:462015年亚冠纪念徽章
日期:2015-07-23 11:58:122015亚冠之广州富力
日期:2015-07-07 08:26:172015亚冠之塔什干棉农
日期:2015-06-29 09:08:072015年亚洲杯之伊朗
日期:2015-03-08 20:51:012015年迎新春徽章
日期:2015-03-04 09:58:11未羊
日期:2014-10-16 22:41:47处女座
日期:2014-10-16 15:33:33酉鸡
日期:2014-03-13 12:54:10巳蛇
日期:2014-03-10 14:39:052015亚冠之德黑兰石油
日期:2015-07-29 12:46:372015亚冠之德黑兰石油
日期:2015-08-07 12:54:11
9 [报告]
发表于 2013-07-09 09:36 |只看该作者
回复 8# 88626285

打个包上传嘛
  1. [WilliBhamlll@CC ~]$ awk 'NR<3{print;next}{a[gensub(/(.*)/,"","1",$1)]+=$2}END{for(i in a)print i,a[i]}' a.txt
  2. 姓名                 出货数量(件)

  3. 王二麻子 8
  4. 张三 5
  5. [WilliBhamlll@CC ~]$ cat a.txt
  6. 姓名                 出货数量(件)

  7. 张三(1)            2
  8. 张三(2)            3
  9. 王二麻子(3)      4
  10. 王二麻子(4)      4
复制代码

论坛徽章:
0
10 [报告]
发表于 2013-07-09 09:38 |只看该作者
回复 9# WilliBhamlll


   

combination.rar

152 Bytes, 下载次数: 2

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP