免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2500 | 回复: 9
打印 上一主题 下一主题

文本处理有难度 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-03-24 22:20 |只看该作者 |倒序浏览
文本
1001 yuwen 90
1001 yingyu 70
1001 shuxue 60
1002 shuxue 65
1002 huaxue 100
1003 yuwen 80
1003 yingyu 30
1003 shuxue 60
1003 huaxue 80
转化为
num yuwen shuxue yingyu huaxue
1001,90,60,70,
1002,,65,,100
1003,80,60,30,80

分数对应相应的科目,num没有该科目的默认为空,请大家帮帮忙,谢谢!

论坛徽章:
1
摩羯座
日期:2014-12-29 15:59:36
2 [报告]
发表于 2011-03-24 23:14 |只看该作者
awk '{a[$1]=a[$1]"\n"$2$3;b[$2]}END{printf "num";for(i in b){printf " "i}print "";for(i in a){printf i;for(j in b){if(match(a[i],j"[0-9]*")){printf ","substr(a[i],RSTART+length(j),RLENGTH-length(j))}else{printf ","}}print ""}}' a.txt

论坛徽章:
0
3 [报告]
发表于 2011-03-24 23:30 |只看该作者
回复 2# ziyunfei


    ok thanks!

论坛徽章:
0
4 [报告]
发表于 2011-03-24 23:45 |只看该作者
看到match,substr,RSTART,RLENGTH使用 学习了  {}

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
5 [报告]
发表于 2011-03-25 02:06 |只看该作者
本帖最后由 yinyuemi 于 2011-03-25 02:11 编辑
  1. echo "1001 yuwen 90
  2. 1001 yingyu 70
  3. 1001 shuxue 60
  4. 1002 shuxue 65
  5. 1002 huaxue 100
  6. 1003 yuwen 80
  7. 1003 yingyu 30
  8. 1003 shuxue 60
  9. 1003 huaxue 80" |awk 'NR==FNR{print;for(i=2;i<=NF;i++) a[i]=$i;l=NF;next}{for(j=2;j<=l;j++) if($0~a[j]) {b[$1 FS j]=$3};p=$1==v?p:++p;c[p]=$1;v=$1}END{for(m=1;m<=p;m++) {printf c[m] FS; for(n=2;n<=l;n++) printf b[c[m] FS n]?b[c[m] FS n] FS:"-" FS;print ""}}' <(echo "num yuwen shuxue yingyu huaxue") - |column -t
  10. num   yuwen  shuxue  yingyu  huaxue
  11. 1001  90     60      70      -
  12. 1002  -      65      -       100
  13. 1003  80     60      30      80
复制代码

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
6 [报告]
发表于 2011-03-25 07:09 |只看该作者
  1. awk '{a[$1 FS $2]=$3;b[$1];c[$2]}
  2. END {   printf "num" OFS;for (i in c) printf i OFS;printf RS;
  3.         for (i in b)
  4.              {  printf i OFS;
  5.                 for (j in c) printf a[i FS j] OFS; printf ORS
  6.              }
  7.     }' OFS=","  infile |sort -n
复制代码

论坛徽章:
0
7 [报告]
发表于 2011-03-25 09:35 |只看该作者
有没有高手用perl来实现

论坛徽章:
1
摩羯座
日期:2014-12-29 15:59:36
8 [报告]
发表于 2011-03-25 10:44 |只看该作者
perl -ane '{$a{$F[0]}{$F[1]}=$F[2];$b{$F[1]}=0}END{print "num";for(keys %b){print " $_"}print "\n";for(sort keys %a){print;for $s (keys %b){print ",$a{$_}{$s}"}print "\n"}}' a.txt

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
9 [报告]
发表于 2011-03-25 13:49 |只看该作者
回复 8# ziyunfei


    收藏这个Perl one liner

论坛徽章:
0
10 [报告]
发表于 2011-03-25 14:25 |只看该作者
很强大
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP