免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2294 | 回复: 9
打印 上一主题 下一主题

[文本处理] gensub问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-11-01 15:08 |只看该作者 |倒序浏览
echo "XabF XcdF XdeF" | gawk '{$0=gensub(/X([^X]+)F/,"\\1",2);print}'
XabF cd XdeF


看到这个命令,不明白/X([^X]+)F/中[^X]是什么意思?\\1 中的两个斜杠是不是前面那个是转义符?

论坛徽章:
0
2 [报告]
发表于 2014-11-01 16:51 |只看该作者
本帖最后由 wmsok 于 2014-11-01 16:51 编辑
  1. [root@localhost wms]# echo "XabF XcdF XdeF" | gawk '{$0=gensub(/X([^X]+)F/,"\\1",2);print}'
  2. XabF cd XdeF
  3. [root@localhost wms]# echo "XabF XcdF XdeF" | gawk '{$0=gensub(/X([^XF]+)F/,"\\1",2);print}'
  4. XabF cd XdeF
  5. [root@localhost wms]# echo "XabF XcdF XdeF" | gawk '{$0=gensub(/X([^F]+)F/,"\\1",2);print}'
  6. XabF cd XdeF
  7. [root@localhost wms]# echo "XabF XcdF XdeF" | gawk '{$0=gensub(/X([^A]+)F/,"\\1",2);print}'
  8. XabF XcdF XdeF
复制代码
为什么?

论坛徽章:
3
天蝎座
日期:2013-12-10 19:37:11酉鸡
日期:2014-08-04 20:05:38双鱼座
日期:2014-08-09 21:53:54
3 [报告]
发表于 2014-11-01 20:18 |只看该作者
回复 1# wmsok


    [^X]是指“非X”字符,也就是只要不是X字符的话 其他字符这个正则都可以匹配。

\\1中的两个反斜线 中的第一个反斜线是为了转义第二个反斜线,最终得到’\1'即 匹配到的第一个分组的内容。

论坛徽章:
0
4 [报告]
发表于 2014-11-02 10:48 |只看该作者
回复 3# 欧阳西风


非常感谢,麻烦解释一下我在2楼提的问题,为什么^F也可以,而^A就不行了了?

   

论坛徽章:
3
天蝎座
日期:2013-12-10 19:37:11酉鸡
日期:2014-08-04 20:05:38双鱼座
日期:2014-08-09 21:53:54
5 [报告]
发表于 2014-11-02 12:44 |只看该作者
回复 4# wmsok




你使用^A之所以不行是因为正则表达式默认是贪恋匹配,那么/X([^A]+)F/匹配的字符串是XabF XcdF XdeF, 而不是你认为的“XabF"所以根本就没有第二个匹配的字符串 而你在gensub中指定了替换第二次匹配的情况,那肯定是没有的了 也就相当于没有进行任何操作。

而/X([^X]+)F/既然限制了X跟F之间的字符不能是”X",所以即使是贪婪匹配也只能匹配到XabF或者XcdF或者XdeF而不能一下子匹配整个字符串,这也就达到了我们替换第二个匹配的目的。

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
6 [报告]
发表于 2014-11-03 09:34 |只看该作者
[^X]表示除X以外的任意字符

\\1是对正则第一对小括号进行反向引用

论坛徽章:
2
摩羯座
日期:2014-11-03 15:28:56卯兔
日期:2015-01-04 17:20:51
7 [报告]
发表于 2014-11-03 10:23 |只看该作者
回复 5# 欧阳西风


    赞一个,忘了贪婪匹配了,想半天没想出来,差点抓破头皮

论坛徽章:
3
天蝎座
日期:2013-12-10 19:37:11酉鸡
日期:2014-08-04 20:05:38双鱼座
日期:2014-08-09 21:53:54
8 [报告]
发表于 2014-11-03 13:41 |只看该作者
回复 7# bulletmarquis


    有时候我也会出现这种头脑一时短路的情况

论坛徽章:
11
CU十二周年纪念徽章
日期:2013-10-24 15:41:342015年辞旧岁徽章
日期:2015-03-03 16:54:15丑牛
日期:2015-01-14 10:36:40技术图书徽章
日期:2015-01-12 15:46:11白羊座
日期:2014-11-14 09:35:36狮子座
日期:2014-10-30 13:18:49巳蛇
日期:2014-10-11 12:52:08子鼠
日期:2014-09-28 14:11:06双鱼座
日期:2014-04-22 13:05:48午马
日期:2014-02-11 17:58:002015年迎新春徽章
日期:2015-03-04 09:55:28
9 [报告]
发表于 2014-11-03 14:39 |只看该作者
路过,我是来学习的。

论坛徽章:
0
10 [报告]
发表于 2014-11-04 17:29 |只看该作者
回复 5# 欧阳西风


谢谢,真大神也!

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP