免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3580 | 回复: 10

[文本处理] 求个数 [复制链接]

论坛徽章:
0
发表于 2013-12-16 17:21 |显示全部楼层
大牛们,提前圣诞节快乐
源文件:
  1. 2013/12/14      11nnttuu
  2. 2013/12/13      22nnnuyy
  3. 2013/12/10      11nnuuny
复制代码
目标文件
  1. 2013/12/14      11nnttuu 2 2
  2. 2013/12/13      22nnnuyy 3 1
  3. 2013/12/10      11nnuuny 3 2
复制代码
想求出每行$2中出现"n“和"u"的个数并卸载每行后面。

论坛徽章:
130
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2013-12-16 17:26 |显示全部楼层
本帖最后由 jason680 于 2013-12-16 17:27 编辑

回复 1# 秋天的絮儿

$ echo '2013/12/14      11nnttuu
2013/12/13      22nnnuyy
2013/12/10      11nnuuny' | awk '{n=gsub("n","n",$2);u=gsub("u","u",$2);print $0,n,u}'
2013/12/14 11nnttuu 2 2
2013/12/13 22nnnuyy 3 1
2013/12/10 11nnuuny 3 2
   

论坛徽章:
92
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2015-02-28 17:45:34CU大牛徽章
日期:2019-10-10 10:55:38ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:28CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
发表于 2013-12-16 17:32 |显示全部楼层
好像我的结果和楼主的不一样,而且也不会“卸载”。。。
  1. [seesea@UC ~]$ awk '{print $0 OFS split($0, A, "n") - 1, split($0, A, "t") - 1}' file
  2. 2013/12/14      11nnttuu 2 2
  3. 2013/12/13      22nnnuyy 3 0
  4. 2013/12/10      11nnuuny 3 0
复制代码

论坛徽章:
92
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2015-02-28 17:45:34CU大牛徽章
日期:2019-10-10 10:55:38ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:28CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
发表于 2013-12-16 17:33 |显示全部楼层
回复 3# seesea2517


    哦,是n和u啊。。。

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
发表于 2013-12-16 17:38 |显示全部楼层
  1. awk '{print $0,gsub(/n/,"",$2),gsub(/u/,"",$2)}'  urfile
  2. awk '{print $0,split($2,n,"n")-1,split($2,u,"u")-1}' urfile
复制代码

论坛徽章:
0
发表于 2013-12-16 18:07 |显示全部楼层
回复 5# 关阴月飞


    是的,我一开始也想到用gsub的,但用错了,谢谢!膜拜!

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
发表于 2013-12-16 19:28 |显示全部楼层
回复 1# 秋天的絮儿
  1. [root@source ~]# cat a
  2. 2013/12/14      11nnttuu
  3. 2013/12/13      22nnnuyy
  4. 2013/12/10      11nnuuny
  5. [root@source ~]# python -c 'for i in open("/root/a").readlines():print i.strip(),i.count("n"),i.count("u")'
  6. 2013/12/14      11nnttuu 2 2
  7. 2013/12/13      22nnnuyy 3 1
  8. 2013/12/10      11nnuuny 3 2
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
发表于 2013-12-16 19:35 |显示全部楼层
  1. [root@localhost ~]# awk '{print $0,gsub("n","&",$2),gsub("u","&",$2)}' i
  2. 2013/12/14      11nnttuu 2 2
  3. 2013/12/13      22nnnuyy 3 1
  4. 2013/12/10      11nnuuny 3 2
  5. [root@localhost ~]#
复制代码

论坛徽章:
36
摩羯座
日期:2013-09-23 16:37:312015年亚洲杯之沙特阿拉伯
日期:2015-04-14 09:10:172015亚冠之柏太阳神
日期:2015-06-25 08:48:212015亚冠之武里南联
日期:2015-07-28 09:01:082015亚冠之莱赫维亚
日期:2015-07-28 15:44:172015亚冠之柏斯波利斯
日期:2015-09-06 14:08:52白银圣斗士
日期:2015-11-25 17:06:2815-16赛季CBA联赛之吉林
日期:2015-12-09 16:59:072016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之辽宁
日期:2016-04-14 09:29:04luobin
日期:2016-06-17 17:46:3615-16赛季CBA联赛之天津
日期:2016-08-16 14:11:01
发表于 2013-12-17 11:06 |显示全部楼层
  1. awk -F "" '{for(i=0;i++<NF;) $i=="n"?a++:$i=="u"?b++:$i;print a,b;a=b=0}'
复制代码

论坛徽章:
36
摩羯座
日期:2013-09-23 16:37:312015年亚洲杯之沙特阿拉伯
日期:2015-04-14 09:10:172015亚冠之柏太阳神
日期:2015-06-25 08:48:212015亚冠之武里南联
日期:2015-07-28 09:01:082015亚冠之莱赫维亚
日期:2015-07-28 15:44:172015亚冠之柏斯波利斯
日期:2015-09-06 14:08:52白银圣斗士
日期:2015-11-25 17:06:2815-16赛季CBA联赛之吉林
日期:2015-12-09 16:59:072016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之辽宁
日期:2016-04-14 09:29:04luobin
日期:2016-06-17 17:46:3615-16赛季CBA联赛之天津
日期:2016-08-16 14:11:01
发表于 2013-12-17 11:11 |显示全部楼层
回复 8# yestreenstars
大神这个&是什么用法?man里没找到,请大神指点下

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

DTCC2020中国数据库技术大会

【架构革新 高效可控】2020年12月21日-23日第十一届中国数据库技术大会将在北京隆重召开。

大会设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

http://dtcc.it168.com


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP