免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3964 | 回复: 10
打印 上一主题 下一主题

[文本处理] 求个数 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-12-16 17:21 |只看该作者 |倒序浏览
大牛们,提前圣诞节快乐
源文件:
  1. 2013/12/14      11nnttuu
  2. 2013/12/13      22nnnuyy
  3. 2013/12/10      11nnuuny
复制代码
目标文件
  1. 2013/12/14      11nnttuu 2 2
  2. 2013/12/13      22nnnuyy 3 1
  3. 2013/12/10      11nnuuny 3 2
复制代码
想求出每行$2中出现"n“和"u"的个数并卸载每行后面。

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
2 [报告]
发表于 2013-12-16 17:26 |只看该作者
本帖最后由 jason680 于 2013-12-16 17:27 编辑

回复 1# 秋天的絮儿

$ echo '2013/12/14      11nnttuu
2013/12/13      22nnnuyy
2013/12/10      11nnuuny' | awk '{n=gsub("n","n",$2);u=gsub("u","u",$2);print $0,n,u}'
2013/12/14 11nnttuu 2 2
2013/12/13 22nnnuyy 3 1
2013/12/10 11nnuuny 3 2
   

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
3 [报告]
发表于 2013-12-16 17:32 |只看该作者
好像我的结果和楼主的不一样,而且也不会“卸载”。。。
  1. [seesea@UC ~]$ awk '{print $0 OFS split($0, A, "n") - 1, split($0, A, "t") - 1}' file
  2. 2013/12/14      11nnttuu 2 2
  3. 2013/12/13      22nnnuyy 3 0
  4. 2013/12/10      11nnuuny 3 0
复制代码

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
4 [报告]
发表于 2013-12-16 17:33 |只看该作者
回复 3# seesea2517


    哦,是n和u啊。。。

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
5 [报告]
发表于 2013-12-16 17:38 |只看该作者
  1. awk '{print $0,gsub(/n/,"",$2),gsub(/u/,"",$2)}'  urfile
  2. awk '{print $0,split($2,n,"n")-1,split($2,u,"u")-1}' urfile
复制代码

论坛徽章:
0
6 [报告]
发表于 2013-12-16 18:07 |只看该作者
回复 5# 关阴月飞


    是的,我一开始也想到用gsub的,但用错了,谢谢!膜拜!

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
7 [报告]
发表于 2013-12-16 19:28 |只看该作者
回复 1# 秋天的絮儿
  1. [root@source ~]# cat a
  2. 2013/12/14      11nnttuu
  3. 2013/12/13      22nnnuyy
  4. 2013/12/10      11nnuuny
  5. [root@source ~]# python -c 'for i in open("/root/a").readlines():print i.strip(),i.count("n"),i.count("u")'
  6. 2013/12/14      11nnttuu 2 2
  7. 2013/12/13      22nnnuyy 3 1
  8. 2013/12/10      11nnuuny 3 2
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
8 [报告]
发表于 2013-12-16 19:35 |只看该作者
  1. [root@localhost ~]# awk '{print $0,gsub("n","&",$2),gsub("u","&",$2)}' i
  2. 2013/12/14      11nnttuu 2 2
  3. 2013/12/13      22nnnuyy 3 1
  4. 2013/12/10      11nnuuny 3 2
  5. [root@localhost ~]#
复制代码

论坛徽章:
36
摩羯座
日期:2013-09-23 16:37:312015年亚洲杯之沙特阿拉伯
日期:2015-04-14 09:10:172015亚冠之柏太阳神
日期:2015-06-25 08:48:212015亚冠之武里南联
日期:2015-07-28 09:01:082015亚冠之莱赫维亚
日期:2015-07-28 15:44:172015亚冠之柏斯波利斯
日期:2015-09-06 14:08:52白银圣斗士
日期:2015-11-25 17:06:2815-16赛季CBA联赛之吉林
日期:2015-12-09 16:59:072016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之辽宁
日期:2016-04-14 09:29:04luobin
日期:2016-06-17 17:46:3615-16赛季CBA联赛之天津
日期:2016-08-16 14:11:01
9 [报告]
发表于 2013-12-17 11:06 |只看该作者
  1. awk -F "" '{for(i=0;i++<NF;) $i=="n"?a++:$i=="u"?b++:$i;print a,b;a=b=0}'
复制代码

论坛徽章:
36
摩羯座
日期:2013-09-23 16:37:312015年亚洲杯之沙特阿拉伯
日期:2015-04-14 09:10:172015亚冠之柏太阳神
日期:2015-06-25 08:48:212015亚冠之武里南联
日期:2015-07-28 09:01:082015亚冠之莱赫维亚
日期:2015-07-28 15:44:172015亚冠之柏斯波利斯
日期:2015-09-06 14:08:52白银圣斗士
日期:2015-11-25 17:06:2815-16赛季CBA联赛之吉林
日期:2015-12-09 16:59:072016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之辽宁
日期:2016-04-14 09:29:04luobin
日期:2016-06-17 17:46:3615-16赛季CBA联赛之天津
日期:2016-08-16 14:11:01
10 [报告]
发表于 2013-12-17 11:11 |只看该作者
回复 8# yestreenstars
大神这个&是什么用法?man里没找到,请大神指点下

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP