免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 4604 | 回复: 6
打印 上一主题 下一主题

[文本处理] awk的gsub替换&字符的问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-04-15 10:44 |只看该作者 |倒序浏览
  1. cat urfile
  2. !@#$%^&*        ()|1|2|3|4|5|6
复制代码
希望的结果
  1. !@#$%^&*    ()
  2. !@#$%^&*    1
  3. !@#$%^&*    2
  4. !@#$%^&*    3
  5. !@#$%^&*    4
  6. !@#$%^&*    5
  7. !@#$%^&*    6
复制代码
我写的命令
  1. awk -vOFS="\t" -F"\t" '{a="\n"$1"\t";gsub(/\|/,a);print}'
复制代码
结果是
  1. !@#$%^&*        ()
  2. !@#$%^|*        1
  3. !@#$%^|*        2
  4. !@#$%^|*        3
  5. !@#$%^|*        4
  6. !@#$%^|*        5
  7. !@#$%^|*        6
复制代码
原因已经找到了,就是第一个字段中含有&字符,后面的替换中把它识别成替换以匹配内容了。
暂时再替换一次解决问题。
求规避这个问题的写法。

论坛徽章:
0
2 [报告]
发表于 2013-04-15 10:56 |只看该作者
感谢分享,

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
3 [报告]
发表于 2013-04-15 11:02 |只看该作者

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
4 [报告]
发表于 2013-04-15 11:21 |只看该作者
  1. awk -F "[\t|]" '{s=$1;for(i=2;i<=NF;i++)print s"\t"$i}'
复制代码
  1. awk -vRS="|" 'NR==1{s=$1}NR>1{$0=s"\t"$0}1'
复制代码
  1. sed -r 's/([^\t]*\t)([^|]*)\|(.*)/\1\2\n\1\3/;P;D'
复制代码

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
5 [报告]
发表于 2013-04-15 11:49 |只看该作者
  1. awk -vOFS="\t" '{s=$1;split($2,a,"|");for(i=1;i<=asorti(a,b);i++)print s,a[b[i]]}'
复制代码

论坛徽章:
8
双子座
日期:2013-08-31 07:37:12金牛座
日期:2013-09-09 18:49:12处女座
日期:2013-09-23 11:43:14处女座
日期:2013-10-09 19:48:21狮子座
日期:2014-03-24 18:22:12丑牛
日期:2014-04-22 22:07:51申猴
日期:2014-06-12 21:54:13双鱼座
日期:2014-06-13 21:52:31
6 [报告]
发表于 2013-04-15 23:21 |只看该作者
  1. perl -F'\||\s+' -ane 'print  map "$F[0]\t$_\n",@F[1..$#F]'  filename
复制代码

论坛徽章:
0
7 [报告]
发表于 2013-04-16 00:12 |只看该作者
回复 3# waker
多谢 waker 大牛,那个链接是我想看的
也感谢其他几位的回答

多一次替换不可避免:
  1. awk -vOFS="\t" -F"\t" '{a="\n"$1"\t";gsub(/\&/,"\\\\&",a);gsub(/\|/,a);print}'
复制代码
或者
  1. awk -vOFS="\t" -F"\t" '{a="\n"$1"\t";gsub(/\|/,a);gsub(/\|/,"\\&");print}'
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP