免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 2660 | 回复: 11
打印 上一主题 下一主题

[文本处理] 请高手解答下这个文本怎么处理,谢谢。 [复制链接]

论坛徽章:
3
CU大牛徽章
日期:2013-03-13 15:15:08CU大牛徽章
日期:2013-03-13 15:26:06CU大牛徽章
日期:2013-03-13 15:26:47
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-03-21 20:09 |只看该作者 |倒序浏览
本帖最后由 quidway668 于 2013-03-21 22:02 编辑

1个业务需求,请帮忙解答下。谢谢。

有三个如下文本:

第一列id   第二列类型   第三列级别  第四列时间(假设秒计时)

a.log

154122111  charge    lv_to_16  120000
154122111  charge    lv_to_17  130000
154122333  nocharge  lv_to_17  141000
154122333  nocharge  lv_to_18  151000

b.log

154122333  nocharge  lv_to_15  121000
154122555  charge    lv_to_19  132000
154122111  charge    lv_to_18  140000

c.log

154122555  nocharge  lv_to_18  122000
154122333  nocharge  lv_to_16  131000
154122555  charge    lv_to_20  142000

三个文本,找出其中charge ,得到:
a.log:154122111  charge    lv_to_16  120000
a.log:154122111  charge    lv_to_17  130000
b.log:154122555  charge    lv_to_19  132000
b.log:154122111  charge    lv_to_18  140000
c.log:154122555  charge    lv_to_20  142000

需求,找出三个文本中charge的所有记录,按第一列为:级别段  第二列为:平均时间 打印出来。

下面列出的值都是假设的,比如1980、1180等等不是实际结果.
avg_time:16-17级(第三列)的每个uid(第一列) 的时间差(第四列),这些uid的时间差相加为总和,总和 除以当前级别段(比如16-17级)的唯一uid数。

输出记录例如:
lv_to_16:lv_to_17  avg_time: 1980
lv_to_17:lv_to_18  avg_time: 1180
lv_to_18:lv_to_19  avg_time: 1390
lv_to_19:lv_to_20  avg_time: 1809

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2013-03-21 20:31 |只看该作者
楼主,以这个为例子,解释一下avg_time是怎么算的吧。神马时间差,神马总和,神马当前级别段唯一id数,这都是神马啊?!
lv_to_16:lv_to_17  avg_time: 1980

论坛徽章:
3
CU大牛徽章
日期:2013-03-13 15:15:08CU大牛徽章
日期:2013-03-13 15:26:06CU大牛徽章
日期:2013-03-13 15:26:47
3 [报告]
发表于 2013-03-21 21:12 |只看该作者
回复 2# yestreenstars

抱歉,可能没描述清楚。
是这样的:
想要的avg_time为:

16-17级(第三列)的每个uid(第一列) 的时间差(第四列),这些uid的时间差相加为总和,总和 除以当前级别段(比如16-17级)的唯一uid数。

   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
4 [报告]
发表于 2013-03-21 21:17 |只看该作者
回复 3# quidway668


    1980是怎么算出来的?

论坛徽章:
3
CU大牛徽章
日期:2013-03-13 15:15:08CU大牛徽章
日期:2013-03-13 15:26:06CU大牛徽章
日期:2013-03-13 15:26:47
5 [报告]
发表于 2013-03-21 21:25 |只看该作者
回复 4# yestreenstars

这里的值都是假设的,1980不是实际结果.
avg_time:16-17级(第三列)的每个uid(第一列) 的时间差(第四列),这些uid的时间差相加为总和,总和 除以当前级别段(比如16-17级)的唯一uid数。


   

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
6 [报告]
发表于 2013-03-21 21:29 |只看该作者
回复 5# quidway668


    好吧,那我帮不了你了。

论坛徽章:
3
CU大牛徽章
日期:2013-03-13 15:15:08CU大牛徽章
日期:2013-03-13 15:26:06CU大牛徽章
日期:2013-03-13 15:26:47
7 [报告]
发表于 2013-03-21 21:56 |只看该作者
回复 6# yestreenstars
还是谢谢你。


   

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
8 [报告]
发表于 2013-03-21 22:27 |只看该作者
回复 1# quidway668


    话说您要啥结果,能不能给个准信,别假设........

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
9 [报告]
发表于 2013-03-22 09:21 |只看该作者
回复 1# quidway668


猜一下:
  1. awk '$2=="charge"' [abc].log | sort -k3 | awk '{s+=$NF}$1!=id{i++}NR>1&&$3!=lv{print lv":"$3"\tavg_time:"s/i;i=1;s=$NF}{id=$1;lv=$3}'
复制代码

论坛徽章:
3
IT运维版块每日发帖之星
日期:2015-12-30 06:20:00IT运维版块每日发帖之星
日期:2016-02-16 06:20:00每日论坛发贴之星
日期:2016-02-16 06:20:00
10 [报告]
发表于 2013-03-22 10:25 |只看该作者
==! 木有看懂需求
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP