免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2734 | 回复: 16
打印 上一主题 下一主题

awk统计问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-12-27 16:15 |只看该作者 |倒序浏览
本帖最后由 sundful 于 2011-12-28 14:53 编辑

有一个文件,格式如下:

  1. 郑州|河南|13511111111
  2. 郑州|河南|13511111111
  3. 郑州|河南|15911111111
  4. 郑州|河南|15022222222
  5. 南充|四川|15822222222
  6. 南充|四川|15933932595
  7. 南充|四川|15933932595
  8. 南充|四川|15933932595
复制代码
第一个属性是城市,第二属性是省份,第三个属性是手机号,
现在想根据省份和城市,计算手机号的pv和uv 即根据省份和城市对手机号去重复或者不去重复
结果如下

  1. 郑州|河南|4|3
  2. 南充|四川|4|2
复制代码
请大侠帮忙!~

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
2 [报告]
发表于 2011-12-27 16:27 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
3 [报告]
发表于 2011-12-27 16:31 |只看该作者
本帖最后由 sundful 于 2011-12-27 16:32 编辑

回复 2# zooyo

就是根据省份和城市,计算对应的手机号码去重复之前的数量和去重复之后的数量!~

郑州|河南|30|15

即河南郑州的手机号码去重复之前是30个,去重复之后是15个




   

论坛徽章:
0
4 [报告]
发表于 2011-12-27 16:34 |只看该作者
回复 3# sundful


   你给的例子好像不够大家施展的吧?按你的要求

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
5 [报告]
发表于 2011-12-27 16:38 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
6 [报告]
发表于 2011-12-27 16:39 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
7 [报告]
发表于 2011-12-27 16:58 |只看该作者
回复 1# sundful

>>请大侠帮忙!~   

请发问者帮个忙....
问题写清楚,数据确实....

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
8 [报告]
发表于 2011-12-27 19:52 |只看该作者
没看明白题目的意思

论坛徽章:
3
2015年迎新春徽章
日期:2015-03-04 09:56:11数据库技术版块每日发帖之星
日期:2016-08-03 06:20:00数据库技术版块每日发帖之星
日期:2016-08-04 06:20:00
9 [报告]
发表于 2011-12-27 20:12 |只看该作者

  1. awk 'BEGIN{FS="|"}{a[$1"|"$2]++}!($0 in c){b[$1"|"$2]++;c[$0]}END{for(i in a)print i"|"a[$1"|"$2]"|"b[$1"|"$2];}'
复制代码

论坛徽章:
0
10 [报告]
发表于 2011-12-28 10:46 |只看该作者
回复 9# cjaizss

版主,统计的好像有点问题,结果全是这样的:
  1. 山东|东营|1494|49
  2. 新疆|哈密|1494|49
  3. 云南|墨江|1494|49
  4. 江苏|仪征|1494|49
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP