免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1848 | 回复: 9

[文本处理] 文件行合并问题,求助 [复制链接]

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
发表于 2016-01-21 21:47 |显示全部楼层
有一文件内容如下:
582.7X497.3
文件1 285.6X464.9
文件2 285.8X464.9
.......
02/21/12 16:09:06
%
803.7X350.9
文件1 160.6X350.9
文件2 159.4X350.1
文件3 160.6X350.9
........
02/21/12 17:03:18
%
每段内容用%分隔,现要将每段内容的第一行和最后一行合并,格式变为:
总尺寸:582.7X497.3     时间:2012-02-21    16:09
文件1 285.6X464.9
文件2 285.8X464.9
.......
%
总尺寸:803.7X350.9   时间:2012-02-21  17:03
文件1 160.6X350.9
文件2 159.4X350.1
文件3 160.6X350.9
........
%

请求帮忙一下,谢谢!

论坛徽章:
12
IT运维版块每日发帖之星
日期:2015-11-17 06:20:00程序设计版块每日发帖之星
日期:2016-01-19 06:20:0015-16赛季CBA联赛之江苏
日期:2016-01-17 15:31:3915-16赛季CBA联赛之上海
日期:2016-01-16 15:44:3015-16赛季CBA联赛之浙江
日期:2016-01-15 20:38:1815-16赛季CBA联赛之北京
日期:2016-01-09 14:30:15CU十四周年纪念徽章
日期:2016-01-07 12:31:5115-16赛季CBA联赛之四川
日期:2016-01-01 11:49:1515-16赛季CBA联赛之深圳
日期:2015-12-24 14:23:4115-16赛季CBA联赛之山西
日期:2015-12-15 16:22:31技术图书徽章
日期:2015-12-10 17:41:0015-16赛季CBA联赛之北控
日期:2016-02-03 10:03:24
发表于 2016-01-21 22:26 |显示全部楼层
本帖最后由 sync_1521 于 2016-01-21 22:38 编辑
  1. awk '/%/{if(s){"date -d \""m"\" \"+%F %H:%M\""|getline n;sub("^[^\n]*","总尺寸:& 时间:"n,s);print s"\n"$0;s=m=""};next}{s=s?s"\n"m:m;m=$0}'  1
  2. 总尺寸:582.7X497.3 时间:2012-02-21 16:09
  3. 文件1 285.6X464.9
  4. 文件2 285.8X464.9
  5. .......
  6. %
  7. 总尺寸:803.7X350.9 时间:2012-02-21 17:03
  8. 文件1 160.6X350.9
  9. 文件2 159.4X350.1
  10. 文件3 160.6X350.9
  11. ........
  12. %
复制代码

论坛徽章:
130
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2016-01-21 23:32 |显示全部楼层
回复 1# lrz

$ awk 'BEGIN{RS="% *\n*";FS=OFS="\n"}NF>2{N=NF-1;sub(/:..$/,"",$N);$1="总尺寸:"$1"\t时间:"$N;--NF;$NF=RT;printf $0}' FILE
总尺寸:582.7X497.3        时间:02/21/12 16:09
文件1 285.6X464.9
文件2 285.8X464.9
.......
%
总尺寸:803.7X350.9        时间:02/21/12 17:03
文件1 160.6X350.9
文件2 159.4X350.1
文件3 160.6X350.9
........
%

   

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
发表于 2016-01-22 01:11 |显示全部楼层
sync_1521 发表于 2016-01-21 22:26


0lrz@01:05 Tmpfs $awk '/%/{if(s){"date -d \""m"\" \"+%F %H:%M\""|getline n;sub("^[^\n]*","总尺寸:& 时间:"n,s);print s"\n"$0;s=m=""};next}{s=s?s"\n"m:m;m=$0}'  output_file1.tmp

awk: cmd. line:1: (FILENAME=output_file1.tmp FNR=6092) fatal: cannot open pipe `date -d "03/12/06 10:51:53" "+%F %H:%M"' (打开的文件过多)

0lrz@01:05 Tmpfs $wc -l output_file1.tmp
33092 output_file1.tmp

晕!

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
发表于 2016-01-22 01:17 |显示全部楼层
回复 3# jason680


    时间格式不对,帮忙改一下好吗?对awk不熟悉。

论坛徽章:
130
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2016-01-22 07:59 |显示全部楼层
回复 5# lrz

Here you are

$ awk 'BEGIN{RS="% *\n*";FS=OFS="\n"}NF>2{--NF;split($NF,a,"[/ :]");$1="总尺寸:"$1"\t时间:20"a[3]"-"a[1]"-"a[2]"\t"a[4]":"a[5];$NF=RT;printf $0}' FILE
总尺寸:582.7X497.3        时间:2012-02-21        16:09
文件1 285.6X464.9
文件2 285.8X464.9
.......
%
总尺寸:803.7X350.9        时间:2012-02-21        17:03
文件1 160.6X350.9
文件2 159.4X350.1
文件3 160.6X350.9
........
%

   

论坛徽章:
12
IT运维版块每日发帖之星
日期:2015-11-17 06:20:00程序设计版块每日发帖之星
日期:2016-01-19 06:20:0015-16赛季CBA联赛之江苏
日期:2016-01-17 15:31:3915-16赛季CBA联赛之上海
日期:2016-01-16 15:44:3015-16赛季CBA联赛之浙江
日期:2016-01-15 20:38:1815-16赛季CBA联赛之北京
日期:2016-01-09 14:30:15CU十四周年纪念徽章
日期:2016-01-07 12:31:5115-16赛季CBA联赛之四川
日期:2016-01-01 11:49:1515-16赛季CBA联赛之深圳
日期:2015-12-24 14:23:4115-16赛季CBA联赛之山西
日期:2015-12-15 16:22:31技术图书徽章
日期:2015-12-10 17:41:0015-16赛季CBA联赛之北控
日期:2016-02-03 10:03:24
发表于 2016-01-22 09:59 |显示全部楼层
回复 4# lrz
改成这样试试
  1. awk '/%/{if(s){"date -d \""m"\" \"+%F %H:%M\""|getline n;close("date -d \""m"\" \"+%F %H:%M\"");sub("^[^\n]*","总尺寸:& 时间:"n,s);print s"\n"$0;s=m=""};next}{s=s?s"\n"m:m;m=$0}'
复制代码

论坛徽章:
130
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2016-01-22 10:12 |显示全部楼层
回复 7# sync_1521

cmd=...; cmd | getline n; close(cmd);
   

论坛徽章:
12
IT运维版块每日发帖之星
日期:2015-11-17 06:20:00程序设计版块每日发帖之星
日期:2016-01-19 06:20:0015-16赛季CBA联赛之江苏
日期:2016-01-17 15:31:3915-16赛季CBA联赛之上海
日期:2016-01-16 15:44:3015-16赛季CBA联赛之浙江
日期:2016-01-15 20:38:1815-16赛季CBA联赛之北京
日期:2016-01-09 14:30:15CU十四周年纪念徽章
日期:2016-01-07 12:31:5115-16赛季CBA联赛之四川
日期:2016-01-01 11:49:1515-16赛季CBA联赛之深圳
日期:2015-12-24 14:23:4115-16赛季CBA联赛之山西
日期:2015-12-15 16:22:31技术图书徽章
日期:2015-12-10 17:41:0015-16赛季CBA联赛之北控
日期:2016-02-03 10:03:24
发表于 2016-01-22 10:20 |显示全部楼层
本帖最后由 sync_1521 于 2016-01-22 10:24 编辑

回复 8# jason680

学习了
  1. awk '/%/{if(s){cmd="date -d \""m"\" \"+%F %H:%M\"";cmd|getline n;close(cmd);sub("^[^\n]*","总尺寸:& 时间:"n,s);print s"\n"$0;s=m=""};next}{s=s?s"\n"m:m;m=$0}'
复制代码

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
发表于 2016-01-22 23:03 |显示全部楼层
谢谢各位,解决了。
经测试,
awk 'BEGIN{RS="% *\n*";FS=OFS="\n"}NF>2{--NF;split($NF,a,"[/ :]");$1="总尺寸:"$1"\t时间:20"a[3]"-"a[1]"-"a[2]"\t"a[4]":"a[5];$NF=RT;printf $0}' FILE
高效点。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

DTCC2020中国数据库技术大会

【架构革新 高效可控】2020年12月21日-23日第十一届中国数据库技术大会将在北京隆重召开。

大会设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

http://dtcc.it168.com


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP