免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3132 | 回复: 2
打印 上一主题 下一主题

[文本处理] [求助]一组数据整理办法 [复制链接]

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
1 [报告]
发表于 2013-04-16 11:33 |显示全部楼层
你目前做到哪里,有啥问题可以发出来,大家讨论讨论。
如果没有头绪,建议用 awk 试试。

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
2 [报告]
发表于 2013-04-16 17:29 |显示全部楼层
我也觉得是这样的。
  1. [seesea2517@UC ~] $awk -F"," '{sum[$7,$8]+=$13; if(! ($7 SUBSEP $8 SUBSEP $2 in ar)) count[$7,$8]++; ar[$7,$8,$2]++} END{for(i in sum) print gensub(/[^0-9]/, "-", "x", i) " : " sum[i] " : " count[i]}' file
  2. 898-0762 : 40 : 1
  3. 220-022 : 42 : 2
  4. 898-0898 : 12 : 1

  5. [seesea2517@UC ~] $cat file
  6. 20,13016236390,0,0,0,0,898,0898,9999999999,,2,0,6,0,0,0,0
  7. 21,13016240088,0,0,0,0,898,0762,9999999999,,2,0,20,0,0,0,0
  8. 24,13032256323,0,0,0,0,220,022,9999999999,,2,0,21,0,0,0,0
  9. 20,13016236390,0,0,0,0,898,0898,9999999999,,2,0,6,0,0,0,0
  10. 21,13016240088,0,0,0,0,898,0762,9999999999,,2,0,20,0,0,0,0
  11. 24,xxxxxxxxxxx,0,0,0,0,220,022,9999999999,,2,0,21,0,0,0,0
复制代码

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
3 [报告]
发表于 2013-04-16 17:54 |显示全部楼层
回复 6# reyleon


    其实lz表达的还算好了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP