免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 8213 | 回复: 7

[文本处理] awk-多维数值-行列转换 [复制链接]

论坛徽章:
0
发表于 2021-01-25 09:40 |显示全部楼层
本帖最后由 ontherd 于 2021-01-25 09:42 编辑

问题:假设有张学生成绩表(tb)如下:
姓名 课程 分数
张三 语文 74
张三 数学 83
张三 物理 93
李四 语文 74
李四 数学 84
李四 物理 94
想变成(得到如下结果):
姓名 语文 数学 物理
---- ---- ---- ----
李四 74   84   94
张三 74   83   93
-------------------

以上问题使用AWK命令如何实现?求教

论坛徽章:
0
发表于 2021-01-25 10:29 |显示全部楼层
  1. awk 'BEGIN{print "姓名 语文 数学 物理\n---- ---- ---- ----"}NR>1{name[$1][$2]=$3}END{for(x in name){printf x" ";for(y in name[x]){ printf name[x][y]"   ";};print""};print "-------------------"}' file
复制代码

论坛徽章:
0
发表于 2021-01-25 10:41 |显示全部楼层
回复 2# jzsjm1002

感谢大师回复。一直没有思路~这下思路清晰了。

论坛徽章:
9
射手座
日期:2014-07-29 13:05:07双子座
日期:2015-01-11 17:01:522015年亚洲杯之朝鲜
日期:2015-02-01 16:14:282015亚冠之阿尔艾因
日期:2015-06-04 17:54:40数据库技术版块每日发帖之星
日期:2015-08-02 06:20:00数据库技术版块每日发帖之星
日期:2015-10-28 06:20:00数据库技术版块每日发帖之星
日期:2015-11-26 06:20:0015-16赛季CBA联赛之天津
日期:2016-06-20 17:09:2015-16赛季CBA联赛之青岛
日期:2017-02-26 15:54:19
发表于 2021-02-20 10:28 |显示全部楼层
回复 3# ontherd

for 循环扫描数组元素,print默认是乱序的,不能保证是按照语文,数学、物理的顺序排列的,可以手动指定编号


论坛徽章:
9
射手座
日期:2014-07-29 13:05:07双子座
日期:2015-01-11 17:01:522015年亚洲杯之朝鲜
日期:2015-02-01 16:14:282015亚冠之阿尔艾因
日期:2015-06-04 17:54:40数据库技术版块每日发帖之星
日期:2015-08-02 06:20:00数据库技术版块每日发帖之星
日期:2015-10-28 06:20:00数据库技术版块每日发帖之星
日期:2015-11-26 06:20:0015-16赛季CBA联赛之天津
日期:2016-06-20 17:09:2015-16赛季CBA联赛之青岛
日期:2017-02-26 15:54:19
发表于 2021-02-20 10:30 |显示全部楼层
awk 'BEGIN{print "姓名 语文 数学 物理\n---- ---- ---- ---- "}/语文/{a[$1,1]=$3}/数学/{a[$1,2]=$3}/物理/{a[$1,3]=$3}{b[$1]=1}END{for(i in b)print i,a[i,1],a[i,2],a[i,3];print "---- ---- ---- ----"}'

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
发表于 2021-02-25 11:29 |显示全部楼层
回复 5# stupid_lee

你这写法显然不科学。

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
发表于 2021-02-25 11:54 |显示全部楼层
[root@hk ~]# cat file
姓名 课程 分数
张三 语文 74
张三 数学 83
张三 物理 93
李四 语文 74
李四 数学 84
李四 物理 94
王五 化学 88
朱六 生物 97
张三 生物 89
李四 化学 77
王五 数学 60
[root@hk ~]#
[root@hk ~]#
[root@hk ~]#
[root@hk ~]# cat px.awk
#!/bin/awk -f

NR==1{t=$1;next}

{
    if(!a[$1]++)b[++n]=$1;
    if(!h[$2]++)i[++m]=$2;
    R[$1,$2]=$3
   
}

END {
    for(c=1;c<=m;c++)t=t"\t"i[c];
   
    print t;
   
    for(c=1;c<=n;c++) {
        xm=b[c]
        for(d=1;d<=m;d++) {
            xm=xm"\t"(R[b[c],i[d]]?R[b[c],i[d]]:"-")
        }
        print xm
    }
}
[root@hk ~]#
[root@hk ~]# ./px.awk file
姓名    语文    数学    物理    化学    生物
张三    74      83      93      -       89
李四    74      84      94      77      -
王五    -       60      -       88      -
朱六    -       -       -       -       97
[root@hk ~]#

论坛徽章:
10
15-16赛季CBA联赛之同曦
日期:2016-06-11 19:22:4115-16赛季CBA联赛之深圳
日期:2020-05-31 16:13:5615-16赛季CBA联赛之同曦
日期:2020-01-28 12:42:47每日论坛发贴之星
日期:2016-08-09 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00每日论坛发贴之星
日期:2016-07-12 06:20:00程序设计版块每日发帖之星
日期:2016-07-12 06:20:00程序设计版块每日发帖之星
日期:2016-07-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-04 06:20:0015-16赛季CBA联赛之佛山
日期:2021-02-26 09:33:41
发表于 2021-03-19 11:15 |显示全部楼层
  1. cat b.txt|awk '{if(a==$1){printf $3" "}else{print x;printf $1" "$3" "}}{a=$1}END{print x}'
复制代码


just fun
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP