免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4946 | 回复: 4
打印 上一主题 下一主题

[文本处理] 请教,一个awk格式化的问题 [复制链接]

论坛徽章:
1
数据库技术版块每日发帖之星
日期:2016-02-02 06:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-08-31 23:10 |只看该作者 |倒序浏览
原始数据格式:
24-08-2013        a        1
26-08-2013        b        1
26-08-2013        c        2
26-08-2013        d        4
27-08-2013        a        7
27-08-2013        b        3
27-08-2013        c        10

目的数据格式:
                          a           b           c           d
24-08-2013        1        0        0        0
25-08-2013        0        0        0        0
26-08-2013        0        1        2        4
27-08-2013        7        3        10        0

请教各位高手怎么实现?

论坛徽章:
10
天蝎座
日期:2013-09-22 22:32:23程序设计版块每日发帖之星
日期:2016-08-07 06:20:00lufei
日期:2016-06-17 17:38:40程序设计版块每日发帖之星
日期:2016-06-12 06:20:002016科比退役纪念章
日期:2016-05-31 15:47:20CU十四周年纪念徽章
日期:2016-05-27 12:24:562015年亚洲杯之阿曼
日期:2015-05-03 21:01:352015年辞旧岁徽章
日期:2015-03-03 16:54:15天蝎座
日期:2013-10-20 21:05:24程序设计版块每日发帖之星
日期:2016-08-11 06:20:00
2 [报告]
发表于 2013-08-31 23:42 |只看该作者
本帖最后由 liion631818 于 2013-09-01 00:06 编辑

时间怎么搞...

论坛徽章:
10
天蝎座
日期:2013-09-22 22:32:23程序设计版块每日发帖之星
日期:2016-08-07 06:20:00lufei
日期:2016-06-17 17:38:40程序设计版块每日发帖之星
日期:2016-06-12 06:20:002016科比退役纪念章
日期:2016-05-31 15:47:20CU十四周年纪念徽章
日期:2016-05-27 12:24:562015年亚洲杯之阿曼
日期:2015-05-03 21:01:352015年辞旧岁徽章
日期:2015-03-03 16:54:15天蝎座
日期:2013-10-20 21:05:24程序设计版块每日发帖之星
日期:2016-08-11 06:20:00
3 [报告]
发表于 2013-08-31 23:43 |只看该作者
本帖最后由 liion631818 于 2013-09-01 00:04 编辑

  1. awk -F"[ |\t]*" '
  2. BEGIN{
  3.         size=0
  4. }
  5. {
  6.         size=(size<length($1)?length($1):size)
  7.         table[$1,$2]=$3
  8.         col[$2]++
  9.         row[$1]++
  10. }
  11. END{
  12.         rows=asorti(row, rsort)
  13.         cols=asorti(col, csort)
  14.         for(r=0;r<=rows;r++)
  15.         {
  16.                 fmt=sprintf("%%-%ds", size+5);
  17.                 printf(fmt, rsort[r])
  18.                 for(c=1;c<=cols;c++)
  19.                 {
  20.                         if(!r)
  21.                                 printf("%5s", csort[c]);
  22.                         else
  23.                                 printf("%5s",(table[rsort[r],csort[c]]>0?table[rsort[r],csort[c]]:0))
  24.                 }
  25.                 print "\n"
  26.         }
  27. }
  28. ' 1.txt
复制代码

论坛徽章:
10
天蝎座
日期:2013-09-22 22:32:23程序设计版块每日发帖之星
日期:2016-08-07 06:20:00lufei
日期:2016-06-17 17:38:40程序设计版块每日发帖之星
日期:2016-06-12 06:20:002016科比退役纪念章
日期:2016-05-31 15:47:20CU十四周年纪念徽章
日期:2016-05-27 12:24:562015年亚洲杯之阿曼
日期:2015-05-03 21:01:352015年辞旧岁徽章
日期:2015-03-03 16:54:15天蝎座
日期:2013-10-20 21:05:24程序设计版块每日发帖之星
日期:2016-08-11 06:20:00
4 [报告]
发表于 2013-09-01 00:54 |只看该作者
本帖最后由 liion631818 于 2013-09-01 00:56 编辑

  1. awk -F"[ |\t|-]*" '
  2. BEGIN{
  3.         size=0
  4.         day=24*60*60
  5. }
  6. {
  7.         size=(size<length($1"-"$2"-"$3)?length($1"-"$2"-"$3):size)
  8.        
  9.         time = mktime(sprintf("%04d %02d %02d 0 0 0", $3, $2, $1))
  10.         table[time,$4]=$5
  11.         col[$4]++
  12.         if(NR==1)
  13.         {
  14.                 max = min = time
  15.         }
  16.         else if(time>max)
  17.         {
  18.                 max = time
  19.         }
  20.         else if(time<min)
  21.         {
  22.                 min = time
  23.         }
  24.        
  25. }
  26. END{
  27.         cols=asorti(col, csort)
  28.         for(t=min-day;t<=max;t+=day)
  29.         {
  30.                 fmt=sprintf("%%-%ds", size);
  31.                
  32.                 r=strftime("%d-%m-%Y", t)
  33.                 printf(fmt, t==min-day?" ":r)
  34.                 for(c=1;c<=cols;c++)
  35.                 {
  36.                         if(t==min-day)
  37.                                 printf("%5s", csort[c]);
  38.                         else
  39.                                 printf("%5s",(table[t,csort[c]]>0?table[t,csort[c]]:0))
  40.                 }
  41.                 print "\n"
  42.         }
  43. }
  44. ' 1.txt
复制代码

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
5 [报告]
发表于 2013-09-01 17:45 |只看该作者
本帖最后由 关阴月飞 于 2013-09-01 18:12 编辑

回复 1# youcaihuazi
  1. awk 'BEGIN{printf "\t\t"}
  2. {split($1,t,"-");$1=mktime(t[3]" "t[2]" "t[1]" 0 0 0")}
  3. NR==1{min=$1} $1<min{min=$1} $1>max{max=$1}
  4. {a[$2];b[$1,$2]=$3}
  5. END{for(i in a)printf i"\t";print"";for(i=min;i<=max;i+=86400){printf strftime("%d-%m-%Y",i);for(j in a)printf "\t"(+b[i,j]);print""}}'  file
复制代码
  1. [root@master awktest]# awk 'BEGIN{printf "\t\t"}
  2. {split($1,t,"-");$1=mktime(t[3]" "t[2]" "t[1]" 0 0 0")}
  3. NR==1{min=$1} $1<min{min=$1} $1>max{max=$1}
  4. {a[$2];b[$1,$2]=$3}
  5. END{for(i in a)printf i"\t";print"";for(i=min;i<=max;i+=86400){printf strftime("%d-%m-%Y",i);for(j in a)printf "\t"(+b[i,j]);print""}}'  file
  6.                 a       b       c       d
  7. 24-08-2013      1       0       0       0
  8. 25-08-2013      0       0       0       0
  9. 26-08-2013      0       1       2       4
  10. 27-08-2013      7       3       10      0
  11. [root@master awktest]# cat file
  12. 24-08-2013        a        1
  13. 26-08-2013        b        1
  14. 26-08-2013        c        2
  15. 26-08-2013        d        4
  16. 27-08-2013        a        7
  17. 27-08-2013        b        3
  18. 27-08-2013        c        10
  19. [root@master awktest]#
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP