免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
论坛 程序设计 Shell shell
12下一页
最近访问板块 发新帖
查看: 2888 | 回复: 10
打印 上一主题 下一主题

[文本处理] shell [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2016-01-27 12:56 |只看该作者 |倒序浏览
大家好,我这里有一个文件想要合并第一列相同的那些行。
比如:文件file,内容如下:
wo        1        2        3
wo        d        j        u
ni        8        h        3
ni        e        3        9
ni        3        k        5       
ta        1        6        0
he        h        6        9
he        t        m        8
我想要的输出结果如下:
wo        1;d        2;j        3;u
ni        8;e;3        h;3;k        3;9;5
ta        1        6        0
he        h;t        6;m        9;8
第一列相同的行的其他列都合并,并以分号分开。 输出列之间用\t分隔。

不知道表述清楚没有,急用,谢谢各位大神了!!!

论坛徽章:
29
程序设计版块每日发帖之星
日期:2016-02-29 06:20:0015-16赛季CBA联赛之天津
日期:2016-08-10 10:33:1115-16赛季CBA联赛之深圳
日期:2016-08-17 15:07:2015-16赛季CBA联赛之佛山
日期:2016-11-07 11:33:5015-16赛季CBA联赛之广夏
日期:2016-11-15 09:13:31CU十四周年纪念徽章
日期:2016-11-24 14:12:25极客徽章
日期:2016-12-07 14:03:4015-16赛季CBA联赛之深圳
日期:2016-12-07 17:15:2715-16赛季CBA联赛之北京
日期:2016-12-22 09:30:0115-16赛季CBA联赛之深圳
日期:2016-12-22 10:49:2115-16赛季CBA联赛之山西
日期:2017-02-10 09:05:3215-16赛季CBA联赛之同曦
日期:2017-02-27 14:19:08
2 [报告]
发表于 2016-01-27 13:42 |只看该作者
  1. awk '!a[$1]++{b[++k]=$1}{col2[$1]=col2[$1]";"$2;col3[$1]=col3[$1]";"$3;col4[$1]=col4[$1]";"$4}END{for(i=1;i<=k;++i){print b[i]"\t"substr(col2[b[i]],2)"\t"substr(col3[b[i]],2)"\t"substr(col4[b[i]],2)}}' file
复制代码

论坛徽章:
12
程序设计版块每日发帖之星
日期:2016-01-28 06:20:00程序设计版块每周发帖之星
日期:2016-03-07 16:29:28程序设计版块每日发帖之星
日期:2016-02-04 06:20:00程序设计版块每日发帖之星
日期:2016-02-02 06:20:00每周论坛发贴之星
日期:2016-01-31 22:22:00程序设计版块每日发帖之星
日期:2016-02-01 06:20:00程序设计版块每日发帖之星
日期:2016-01-31 06:20:00每日论坛发贴之星
日期:2016-01-30 06:20:00程序设计版块每日发帖之星
日期:2016-01-30 06:20:00每日论坛发贴之星
日期:2016-01-29 06:20:00程序设计版块每日发帖之星
日期:2016-01-29 06:20:0015-16赛季CBA联赛之福建
日期:2016-04-06 14:19:05
3 [报告]
发表于 2016-01-27 13:51 |只看该作者
楼上好评,,,  学习了!

论坛徽章:
54
2015亚冠之德黑兰石油
日期:2015-07-07 13:00:1615-16赛季CBA联赛之深圳
日期:2016-03-31 09:03:5415-16赛季CBA联赛之辽宁
日期:2016-05-09 20:38:15程序设计版块每日发帖之星
日期:2016-05-12 06:20:0015-16赛季CBA联赛之四川
日期:2016-05-13 15:19:4715-16赛季CBA联赛之福建
日期:2016-05-15 20:24:34每日论坛发贴之星
日期:2016-05-16 06:20:0015-16赛季CBA联赛之吉林
日期:2016-05-26 11:49:4715-16赛季CBA联赛之广东
日期:2016-05-26 13:49:18极客徽章
日期:2016-12-07 14:05:2315-16赛季CBA联赛之广夏
日期:2016-12-20 17:33:532017金鸡报晓
日期:2017-01-10 15:19:56
4 [报告]
发表于 2016-01-27 14:33 |只看该作者
  1. awk '{for(i=2;i<=NF;i++)a[$1,i]=a[$1,i]?a[$1,i]";"$i:$i;b[$1]}END{for(i in b){s=i;for(j=2;j<=NF;j++)s=s"\t"a[i,j];print s}}' file
复制代码

论坛徽章:
1
天蝎座
日期:2014-01-15 16:44:29
5 [报告]
发表于 2016-01-27 14:40 |只看该作者
awk '{if(a[$1]) {split(a[$1],b);a[$1]=b[1]" "b[2]";"$2" "b[3]";"$3" "b[4]";"$4} else {a[$1]=$0}}END{for (i in a) print a[i]}' test.txt | column -t

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
6 [报告]
发表于 2016-01-27 14:43 |只看该作者
本帖最后由 关阴月飞 于 2016-01-27 14:44 编辑
  1. awk '{s[$1];for(i=1;i++<NF;)a[$1,i]=a[$1,i]!=""?a[$1,i]";"$i:$i}END{for(i in s){for(n=1;n++<NF;)b=b"\t"a[i,n];print i,b;b=c}}' urfile
复制代码

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
7 [报告]
发表于 2016-01-27 15:22 |只看该作者
回复 1# biobaby

$ awk '{for(n=2;n<=NF;++n){a[$1,n]=a[$1,n]a[$1,1]$n};a[$1,1]=";";if(!a[$1]++)d[++t]=$1}END{for(n=1;n<=t;++n){p=d[n];for(m=2;m<=t;++m)p=p"\t"a[d[n],m];print p}}' FILE
wo        1;d        2;j        3;u
ni        8;e;3        h;3;k        3;9;5
ta        1        6        0
he        h;t        6;m        9;8

$ awk 'function x(n,p){c="";p=k;for(n=2;n<=NF;++n)p=p"\t"a[n];print p;delete a}{if(k!=$1)if(k)x();k=$1;for(n=1;n<=NF;++n)a[n]=a[n]c$n;c=";"}END{x()}' FILE
wo        1;d        2;j        3;u
ni        8;e;3        h;3;k        3;9;5
ta        1        6        0
he        h;t        6;m        9;8

   

论坛徽章:
0
8 [报告]
发表于 2016-01-27 15:29 |只看该作者
谢谢您。
回复 2# elu_ligao


   

论坛徽章:
0
9 [报告]
发表于 2016-01-27 15:29 |只看该作者
谢谢~
回复 4# haooooaaa


   

论坛徽章:
0
10 [报告]
发表于 2016-01-27 15:30 |只看该作者
谢谢大家 问题已解决,非常感谢
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP