免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1685 | 回复: 9
打印 上一主题 下一主题

[文本处理] 请教这类文本怎么做判断求和 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-12-05 17:39 |只看该作者 |倒序浏览
x|2015-10-23|王五
x|2015-10-22|张三
x|2015-10-21|张三
x|2015-10-20|张三
x|2015-10-19|王五
x|2015-10-16|李四|9
x|2015-10-15|李四|8
x|2015-10-14|李四|1
x|2015-10-13|李四|0
x|2015-10-12|张三
x|2015-10-09|李四|3
x|2015-10-08|李四|9
x|2015-09-30|李四|8
x|2015-07-08|1
x|2015-07-07|1
x|2015-07-06|1
x|2015-07-03|2
x|2015-07-02|1
x|2015-07-01|3

第一行是的第三列是(张三、李四、王五)任意中的一个,则判断第二行,第二行是(张三、李四、王五)任意中的一个继续判断下一行,依次类推,直到其中一行不是他们三个其中一个停止,得出出现张三的次数是4,李四的次数是7,王五的次数是2

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
2 [报告]
发表于 2015-12-05 18:01 |只看该作者
  1. awk -F \| '/张三|李四|王五/{a[$3]++}END{for(i in a)print i,a[i]}'
复制代码

论坛徽章:
0
3 [报告]
发表于 2015-12-05 18:30 |只看该作者
dn833 发表于 2015-12-05 18:01

这是统计全部的,我想如果下一行不符合就直接退出

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
4 [报告]
发表于 2015-12-05 18:50 |只看该作者
  1. awk -F \| '{if(/张三|李四|王五/){a[$3]++}else{for(i in a)print i,a[i];exit}}' file
复制代码

论坛徽章:
780
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
5 [报告]
发表于 2015-12-05 18:50 |只看该作者
回复 1# alunfirst

输出顺序没要求的话
  1. awk -F\| '$3=="张三"||$3=="李四"||$3=="王五"{a[$3]++;next} {for(i in a)print i,a[i];exit}' urfile
复制代码

论坛徽章:
0
6 [报告]
发表于 2015-12-05 19:50 |只看该作者
都不可以啊,因为我下面还有李四的

论坛徽章:
0
7 [报告]
发表于 2015-12-05 19:53 |只看该作者
x|2015-10-23|王五
x|2015-10-22|张三
x|2015-10-21|张三
x|2015-10-20|张三
x|2015-10-19|王五
x|2015-10-16|李四|9
x|2015-10-15|李四|8
x|2015-10-14|李四|1
x|2015-10-13|李四|0
x|2015-10-12|张三
x|2015-10-09|李四|3
x|2015-10-08|李四|9
x|2015-09-30|李四|8
x|2015-07-08|1
x|2015-07-07|1
x|2015-07-06|1
x|2015-07-03|2
x|2015-07-02|1
x|2015-07-01|3
x|2015-10-09|李四|3
x|2015-10-08|李四|9
x|2015-09-30|李四|8

论坛徽章:
780
金牛座
日期:2014-02-26 17:49:58水瓶座
日期:2014-02-26 18:10:15白羊座
日期:2014-04-15 19:29:52寅虎
日期:2014-04-17 19:43:21酉鸡
日期:2014-04-19 21:24:10子鼠
日期:2014-04-22 13:55:24卯兔
日期:2014-04-22 14:20:58亥猪
日期:2014-04-22 16:13:09狮子座
日期:2014-05-05 22:31:17摩羯座
日期:2014-05-06 10:32:53处女座
日期:2014-05-12 09:23:11子鼠
日期:2014-05-21 18:21:27
8 [报告]
发表于 2015-12-05 20:17 |只看该作者
回复 7# alunfirst

针对这个文本,你期望的输出结果是什么?
   

论坛徽章:
5
白羊座
日期:2014-10-28 11:23:27水瓶座
日期:2015-01-20 10:19:022015亚冠之柏斯波利斯
日期:2015-07-11 18:17:2015-16赛季CBA联赛之同曦
日期:2015-12-23 12:38:582016猴年福章徽章
日期:2016-02-18 15:30:34
9 [报告]
发表于 2015-12-05 20:57 |只看该作者
  1. awk 'NR==FNR{a[$1]=0;next}$3 in a{a[$3]++;next}{exit}END{for(i in a)print i, a[i]}' name.lst file.dat
复制代码
name.lst配置要统计的名单
file.dat数据文件

论坛徽章:
6
羊年新春福章
日期:2015-03-03 17:16:28双子座
日期:2015-03-03 17:16:56巳蛇
日期:2015-03-03 17:17:2415-16赛季CBA联赛之福建
日期:2016-03-11 09:05:00黑曼巴
日期:2016-07-07 16:58:1215-16赛季CBA联赛之吉林
日期:2016-11-14 09:23:07
10 [报告]
发表于 2015-12-08 09:19 |只看该作者
本帖最后由 jcdiy0601 于 2015-12-08 09:24 编辑

感觉你可能是这个意思吧?
x|2015-10-23|王五
x|2015-10-22|张三
x|2015-10-21|张三
x|2015-10-20|张三
x|2015-10-19|王五
x|2015-10-16|李四|9
x|2015-10-15|李四|8
x|2015-10-14|李四|1
x|2015-10-13|李四|0
x|2015-10-12|张三
x|2015-10-09|李四|3
x|2015-10-08|李四|9
x|2015-09-30|李四|8
x|2015-07-08|1
x|2015-07-07|1
x|2015-07-06|1
x|2015-07-03|2
x|2015-07-02|1
x|2015-07-01|3
x|2015-10-09|李四|3
x|2015-10-08|李四|9
x|2015-09-30|李四|8

  1. #!/bin/bash

  2. file='test'
  3. num1=0
  4. num2=0
  5. num3=0
  6. while read line
  7. do
  8.         p=`echo $line|awk -F "|" '{print $3}'`
  9.         if [ $p == '张三' ];then
  10.                 let num1+=1
  11.         elif [ $p == '李四' ];then
  12.                 let num2+=1
  13.         elif [ $p == '王五' ];then
  14.                 let num3+=1
  15.         else
  16.                 break
  17.         fi
  18. done < $file

  19. echo '张三:' $num1
  20. echo '李四:' $num2
  21. echo '王五:' $num3
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP