免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1474 | 回复: 5
打印 上一主题 下一主题

[文本处理] 请帮忙处理一个名单,谢谢 [复制链接]

论坛徽章:
18
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:3815-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0020周年集字徽章-年
日期:2023-04-23 11:17:52
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-08-28 23:22 |只看该作者 |倒序浏览
本帖最后由 bikkuri 于 2014-08-28 23:35 编辑

我有一个很长的名单,以  “名字:所在城市” 的格式存放。
  1. namelist='zhang:beijing charles:newyork igarashi:tokyo kawanami:tokyo thomas:newyork amemiya:tokyo ....'
复制代码
我希望得到这样一个数据处理的输出结果:
1.得到所有城市的列表并按字母顺序排序;
2.对于每个城市,统计出在该城市的人的数量,然后按每个人带4个家属,一共预留5个位置;
例如以上列表,希望得到以下输出:
  1. beijing:1 2 3 4 5
  2. newyork:6 7 8 9 10 11 12 13 14 15
  3. tokyo:16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
复制代码
请问应该如何处理以上文本呢?
谢谢!

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
2 [报告]
发表于 2014-08-29 09:38 |只看该作者
本帖最后由 seesea2517 于 2014-08-29 09:39 编辑

回复 1# bikkuri
  1. [seesea@UC ~]$ namelist='zhang:beijing charles:newyork igarashi:tokyo kawanami:tokyo thomas:newyork amemiya:tokyo'
  2. [seesea@UC ~]$ echo -n $namelist | awk 'BEGIN{FS=":"; RS=" "} {ar[$2]++} END{count=1; for(i in ar){printf i":"; for(j = 0; j < ar[i]*5; ++j) {printf count++" "}; printf "\n"}}'        
  3. beijing:1 2 3 4 5
  4. newyork:6 7 8 9 10 11 12 13 14 15
  5. tokyo:16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
复制代码

论坛徽章:
3
天蝎座
日期:2013-12-10 19:37:11酉鸡
日期:2014-08-04 20:05:38双鱼座
日期:2014-08-09 21:53:54
3 [报告]
发表于 2014-08-29 09:59 |只看该作者
回复 1# bikkuri


    在2楼的基础上添加了排序

  1. namelist='hello:london zhang:beijing charles:newyork igarashi:tokyo kawanami:tokyo thomas:newyork amemiya:tokyo'
  2. echo -n $namelist | awk 'BEGIN{FS=":"; RS=" "} {ar[$2]++} END{t=asorti(ar,br);count=1; for(i=1;i<=t;i++){printf br[i]":"; for(j = 0; j < ar[br[i]]*5; ++j) {printf count++" "}; print ""}}'
  3. beijing:1 2 3 4 5
  4. london:6 7 8 9 10
  5. newyork:11 12 13 14 15 16 17 18 19 20
  6. tokyo:21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
复制代码

论坛徽章:
18
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:3815-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0020周年集字徽章-年
日期:2023-04-23 11:17:52
4 [报告]
发表于 2014-08-29 10:31 |只看该作者
非常感谢!

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
5 [报告]
发表于 2014-08-29 11:12 |只看该作者
  1. [root@localhost ~]# awk -F'[: ]' '{for(i=2;i<=NF;i+=2)a[$i]++}END{l=asorti(a,b);for(i=0;i++<l;){printf "%s:",b[i];for(j=n;j++<n+a[b[i]]*5;)printf " %d",j;print "";n+=a[b[i]]*5}}' i
  2. beijing: 1 2 3 4 5
  3. newyork: 6 7 8 9 10 11 12 13 14 15
  4. tokyo: 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
  5. [root@localhost ~]#
复制代码

论坛徽章:
18
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:3815-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0020周年集字徽章-年
日期:2023-04-23 11:17:52
6 [报告]
发表于 2014-08-29 19:48 |只看该作者
谢谢这么多位高手相助。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP