免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: reyleon

[文本处理] 动动脑:数据统计 [复制链接]

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
发表于 2013-11-13 22:30 |显示全部楼层
回复 10# reyleon
关公的问题问得好,不然我也看不懂你那个特殊情况~

   

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
发表于 2013-11-13 22:31 |显示全部楼层
回复 1# reyleon


    这样统计有些坑,某人申时存钱算个人头,也算钱,到酉时再存钱,不算人头,但算钱,这是募捐吗

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
发表于 2013-11-13 22:37 |显示全部楼层
回复 12# yinyuemi


    突然发现,你这句话就是我这个统计问题的精髓

论坛徽章:
36
摩羯座
日期:2013-09-23 16:37:312015年亚洲杯之沙特阿拉伯
日期:2015-04-14 09:10:172015亚冠之柏太阳神
日期:2015-06-25 08:48:212015亚冠之武里南联
日期:2015-07-28 09:01:082015亚冠之莱赫维亚
日期:2015-07-28 15:44:172015亚冠之柏斯波利斯
日期:2015-09-06 14:08:52白银圣斗士
日期:2015-11-25 17:06:2815-16赛季CBA联赛之吉林
日期:2015-12-09 16:59:072016猴年福章徽章
日期:2016-02-18 15:30:3415-16赛季CBA联赛之辽宁
日期:2016-04-14 09:29:04luobin
日期:2016-06-17 17:46:3615-16赛季CBA联赛之天津
日期:2016-08-16 14:11:01
发表于 2013-11-14 09:20 |显示全部楼层
回复 8# yestreenstars
大神,劳烦解释下代码,没理解。

   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
发表于 2013-11-14 09:48 |显示全部楼层
本帖最后由 yestreenstars 于 2013-11-14 09:51 编辑

回复 14# LikeLx
  1. {sub(/:.*/,"",$4)} #去掉$4冒号和它后面的所有字符,也就是只保留小时。

  2. t&&t!=$3" "$4{print t,s,n;s=n=0} #在t存在的情况下,判断日期和小时和t的值是否相等,如果不等就打印t,s,n这三个值,初始化s和n的值。

  3. {if(!a[$1,$3]++)++n;s+=$2;t=$3" "$4} #把$1和$3的值作为下标存入数组,先判断该数组的值是否存在,再自增1,再累加n的值,n就是人数,这样同一天内,同一个卡号就只有第一次的算入人数了,然后累加$2的值,再把日期和小时赋值给t。

  4. END{print t,s,n} #最后把剩余的打印出来。
复制代码

论坛徽章:
5
白羊座
日期:2014-10-28 11:23:27水瓶座
日期:2015-01-20 10:19:022015亚冠之柏斯波利斯
日期:2015-07-11 18:17:2015-16赛季CBA联赛之同曦
日期:2015-12-23 12:38:582016猴年福章徽章
日期:2016-02-18 15:30:34
发表于 2013-11-14 09:53 |显示全部楼层
  1. awk '{a[$3FS$4+0]+=$2;if(!b[$1,$3]++)++c[$3FS$4+0]}END{for(i in a)print i,a[i],c[i]}' file | sort
  2. 2013-11-08 10 1 1
  3. 2013-11-09 12 60 2
  4. 2013-11-09 13 45 2
  5. 2013-11-09 14 10 1
  6. 2013-11-10 12 60 2
  7. 2013-11-10 13 45 2
复制代码
按 yestreenstars思路,修改一下
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP