免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 3150 | 回复: 17
打印 上一主题 下一主题

规则文件段落分割成多个文件问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-10-27 10:48 |只看该作者 |倒序浏览
# cat t1
--=--=--=--=--=--
a1 11 ccc
111111
111111
--=--=--=--=--=--
a2 22 ccc
22222

23423
--=--=--=--=--=--
a3 33 ccc
sdfs
sdfs

24444444
--=--=--=--=--=--
a4 44 ddd
sdfsdf
dfsdf

t1文件中有很多段内容,每一段都是以--=--=--=--=--=--分隔的
现在想要对这个文件的内容进行分割成多个文件
想要得到的结果如下
#cat a1.1
11
#cat a1.2
ccc
111111
111111
#cat a2.1
22
#cat a2.2
ccc
22222

23423
#cat a3.1
33
#cat a3.2
ccc
sdfs
sdfs

24444444
......

请教高手

[ 本帖最后由 泛泛之辈 于 2009-10-27 10:49 编辑 ]

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
2 [报告]
发表于 2009-10-27 10:58 |只看该作者
awk

论坛徽章:
0
3 [报告]
发表于 2009-10-27 10:59 |只看该作者
黑哥帮忙写个试试,谢谢哈

论坛徽章:
0
4 [报告]
发表于 2009-10-27 11:05 |只看该作者
  1. awk -v RS='[-=]+' -F "\n" '{split($2,M," ");print M[2]>M[1]".1";print M[3]>M[1]".2";for (i=3;i<NF;i++) print $i>M[1]".2"}' file
复制代码

[ 本帖最后由 ywlscpl 于 2009-10-27 11:06 编辑 ]

论坛徽章:
0
5 [报告]
发表于 2009-10-27 11:16 |只看该作者
原帖由 ywlscpl 于 2009-10-27 11:05 发表
awk -v RS='[-=]+' -F "\n" '{split($2,M," ");print M[2]>M[1]".1";print M[3]>M[1]".2";for (i=3;iM[1]".2"}' file



多谢

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
6 [报告]
发表于 2009-10-27 11:16 |只看该作者

回复 #3 泛泛之辈 的帖子

源文件格式有规律吗?
  1. awk 'NF==3{f1=$1".1";f2=$1".2";print $2>f1;print $3 >f2;next}!/-$/{print >f2}' urfile
复制代码

论坛徽章:
0
7 [报告]
发表于 2009-10-27 11:26 |只看该作者

回复 #6 blackold 的帖子

--=--=--=--=--=--
a5 55 ddd
sdfsdf dd ac
dfsdf
ad 22 234
ss
....

这种处理就有问题了

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
8 [报告]
发表于 2009-10-27 11:32 |只看该作者

回复 #7 泛泛之辈 的帖子

  1. awk '/-$/{f=0;next}!f{f1=$1".1";f2=$1".2";print $2>f1;print $3 >f2;f=!f;next}{print >f2}' urfile
复制代码

论坛徽章:
0
9 [报告]
发表于 2009-10-27 11:46 |只看该作者
多谢各位,文本中还有一个特点刚才忘记说了,就是第一列一样的,第二列有不一样的,如下的a2的第二列有22 55
看来要重新导出分割的格式
--=--=--=--=--=--
a1 11 ccc
111111
111111
--=--=--=--=--=--
a2 22 ccc
22222

23423
--=--=--=--=--=--
a3 33 ccc ddd aa
sdfs
sdfs '\\s/\n/'

24444444
--=--=--=--=--=--
a2 55 ddd hhh
sdfsdf "sd\taa"
dfsdf
处理后显示
#cat a1__11
ccc
111111
111111
#cat a2__22
ccc
22222

23423
#cat a3__33
ccc ddd aa
sdfs
sdfs '\\s/\n/'

24444444
#cat a2__55
ddd hhh
sdfsdf "sd\taa"
dfsdf

[ 本帖最后由 泛泛之辈 于 2009-10-27 11:55 编辑 ]

论坛徽章:
0
10 [报告]
发表于 2009-10-27 11:57 |只看该作者
awk '/^--/{getline;f1=$1".1";f2=$1".2";print $2 > f1;print $3 > f2;next}!/^--/{print $0 > f2}' file
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP