免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1030 | 回复: 1
打印 上一主题 下一主题

[文本处理] 回答一个3年前的文档字符处理问题:附链接 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2017-05-26 08:18 |只看该作者 |倒序浏览
本帖最后由 me09 于 2017-05-26 08:38 编辑
  1. #!/bin/bash
  2. while read line
  3. do
  4.         echo `echo $line|tr  "[ #{}]"  "\n"|awk 'BEGIN{RS="[\n]+";ORS=" "}{print $0}'`
  5. done
复制代码

cat x.txt
1. {#a#a#}
2. {#a}a#}
3. {#a#}a#}
fdss{#sdjas#}fdjsf{#dsfjs#}dfs
fdss{#sd#jas#}fdjsf{#ds#fjs#}dfs
fdss{#sdjas#fdjsf#dsfjs#}dfs
fdss{#sd#jas#}fdjsf{#ds#fjs#}dfs
fdss{#sd#jas#}fdjsf{#ds#fjs#}dfs
fdss{#sdjas#}fdjsf{#dsfjs#}dfs

运行:bash x.sh < x.txt
1. a a
2. a a
3. a a
fdss sdjas fdjsf dsfjs dfs
fdss sd jas fdjsf ds fjs dfs
fdss sdjas fdjsf dsfjs dfs
fdss sd jas fdjsf ds fjs dfs
fdss sd jas fdjsf ds fjs dfs
fdss sdjas fdjsf dsfjs dfs

个人理解这位坛友,是想把文档处理的规整化,至少可以被AWK 规范化处理:
原帖地址http://bbs.chinaunix.net/thread-4130416-2-1.html
稍微修改下 就是+号链接版本的输出:如下
  1. #!/bin/bash
  2. while read line
  3. do
  4.         echo `echo $line|tr  "[ #{}]"  "\n"|awk 'BEGIN{RS="[\n]+";ORS="+"}{print $0}'|sed 's/+$/\n/'`
  5. done
复制代码


cat x.txt
1. {#a#a#}
2. {#a}a#}
3. {#a#}a#}
fdss{#sdjas#}fdjsf{#dsfjs#}dfs
fdss{#sd#jas#}fdjsf{#ds#fjs#}dfs
fdss{#sdjas#fdjsf#dsfjs#}dfs
fdss{#sd#jas#}fdjsf{#ds#fjs#}dfs
fdss{#sd#jas#}fdjsf{#ds#fjs#}dfs
fdss{#sdjas#}fdjsf{#dsfjs#}dfs
------------------------------------------------------
sh x.sh < x.txt
1.+a+a
2.+a+a
3.+a+a
fdss+sdjas+fdjsf+dsfjs+dfs
fdss+sd+jas+fdjsf+ds+fjs+dfs
fdss+sdjas+fdjsf+dsfjs+dfs
fdss+sd+jas+fdjsf+ds+fjs+dfs
fdss+sd+jas+fdjsf+ds+fjs+dfs
fdss+sdjas+fdjsf+dsfjs+dfs



论坛徽章:
0
2 [报告]
发表于 2017-05-26 13:25 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP