免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1927 | 回复: 6
打印 上一主题 下一主题

[文本处理] 这个格式处理帮指点下思路 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-05-03 12:07 |只看该作者 |倒序浏览
两文件处理
文件1有一行共有20个逗号
〈format〉,,,,,,,,,,,,,,,,,,,,
文件2有4行格式如下:
/dir/file1
/dir/file2
/dir/file3
/dir/file4

输出结果:
<format>/dir/file1,/dir/file2,/dir/file3,/dir/file4,,,,,,,,,,,,,,,,,
输出结果中逗号也为20个。

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
2 [报告]
发表于 2013-05-03 12:28 |只看该作者
  1. awk 'BEGIN{FS=OFS=",";n=1}NR==FNR{a[++n]=$0}NR>FNR{print NF;for(i=2;i<NF;i++){$i=a[i]};print}' b.txt a.txt
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
3 [报告]
发表于 2013-05-03 13:18 |只看该作者
本帖最后由 yestreenstars 于 2013-05-06 12:06 编辑
  1. awk 'BEGIN{FS=OFS=","}NR==FNR{a[NR]=$0;next}{for(i=1;i<=NF;i++)$i=$i""a[i]}1'
复制代码

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
4 [报告]
发表于 2013-05-03 13:39 |只看该作者
  1. awk -F,  'FNR==NR{a[NR+1]=$0;next}{printf $1;for(i=2;i<=NF;i++)printf a[i]FS;print ""}'  file2 file1
复制代码

论坛徽章:
93
2015年辞旧岁徽章
日期:2019-10-10 10:51:15CU大牛徽章
日期:2014-02-21 14:21:56CU十二周年纪念徽章
日期:2020-10-15 16:55:55CU大牛徽章
日期:2014-02-21 14:22:07羊年新春福章
日期:2019-10-10 10:51:39CU大牛徽章
日期:2019-10-10 10:55:38季节之章:春
日期:2020-10-15 16:57:40ChinaUnix元老
日期:2019-10-10 10:54:42季节之章:冬
日期:2019-10-10 10:57:17CU大牛徽章
日期:2014-02-21 14:22:52CU大牛徽章
日期:2014-03-13 10:40:30CU大牛徽章
日期:2014-02-21 14:23:15
5 [报告]
发表于 2013-05-03 14:18 |只看该作者
来晚了就换sed吧。其实也很喜欢awk的。
  1. [seesea@UC find]$ head 1.txt 2.txt
  2. ==> 1.txt <==
  3. <format>,,,,,,,,,,,,,,,,,,,,

  4. ==> 2.txt <==
  5. /dir/file1
  6. /dir/file2
  7. /dir/file3
  8. /dir/file4
  9. [seesea@UC find]$ sed -r ':a; N; $!ba; h; s/[^\n]//g; s/\n/,/g; s/.//; G; s/([^\n]*)\n(.*)\n([^,]*)\1(.*)/\3\2\4/; s/\n/,/g' 2.txt 1.txt
  10. <format>/dir/file1,/dir/file2,/dir/file3,/dir/file4,,,,,,,,,,,,,,,,,
复制代码

论坛徽章:
0
6 [报告]
发表于 2013-05-03 23:32 |只看该作者
chen@ubuntu:~$ cat a
,,,,,,,,,,,,,,,,,,,,
chen@ubuntu:~$ cat b
/dir/file1
/dir/file2
/dir/file3
/dir/file4
chen@ubuntu:~$ awk 'BEGIN{FS="";}{for(i=1;i<=NF;i++)print $i;}' a|paste -d" " b -|awk '{printf "%s%s",$1,$2}END{print}'
/dir/file1,/dir/file2,/dir/file3,/dir/file4,,,,,,,,,,,,,,,,, ,

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
7 [报告]
发表于 2013-05-04 01:41 |只看该作者
回复 1# dahaoshanhe

How about this

$ awk -F, -vOFS=, 'NR==FNR{s=s$1",";c++}NR>FNR{NF-=c;$1=$1s;print}' F2 F1
<format>/dir/file1,/dir/file2,/dir/file3,/dir/file4,,,,,,,,,,,,,,,,,

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP