免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 546 | 回复: 3

[文本处理] 请问如何在命令中加入'字符 [复制链接]

论坛徽章:
17
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0015-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:38
发表于 2020-01-12 16:02 |显示全部楼层

大家好!
我有一个问题向大家请教。
有如下一个文本。
<a class3D"user-hover" rel3D"Bin 3LS" id3D"assignee_Bin 3LS" href3D"http://nms-jira.ca.alcatel-lucent.com:8082/secure/ViewProfile.jspa?name3DBin%203LS" style3D"color:#3b73af; text-decoration:none">Bin 3LS (Robert Baker)</a></span></td><td class3D"reporter" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc"><span class3D"tinylink"><a class3D"user-hover" rel3D"jzhu039" id3D"reporter_jzhu039" href3D"http://nms-jira.ca.alcatel-lucent.com:8082/secure/ViewProfile.jspa?name3Djzhu039" style3D"color:#3b73af; text-decoration:none">John Zhu</a></span></td></tr><tr id3D"issuerow484415" rel3D"484415" class3D"issuerow"><td class3D"issuekey" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc"><a class3D"issue-link" href3D"http://nms-jira.ca.alcatel-lucent.com:8082/browse/NSPD-249507" style3D"color:#3b73af; text-decoration:none">NSPD-249507</a></td><td class3D"summary" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc"><p style3D"margin:10px 0 0 0; margin-top:0; margin:0"><a class3D"issue-link" href3D"http://nms-jira.ca.alcatel-lucent.com:8082/browse/NSPD-249507" style3D"color:#3b73af; text-decoration:none">NFM-P 19.9 failed to create new LAG for 7250-IXRs due to out of range auto-assigned by NSP</a> </p></td><td class3D"status" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc"><span class3D" jira-issue-status-lozenge aui-lozenge jira-issue-status-lozenge-blue-gray jira-issue-status-lozenge-new aui-lozenge-subtle jira-issue-status-lozenge-max-width-medium" bgcolor3D"#ffffff" style3D"background:#cccccc; border:1px solid #cccccc; border-radius:3px; color:#333333; display:inline-block; font-size:11px; font-weight:bold; line-height:99%; margin:0; padding:2px 5px; text-align:center; text-decoration:none; text-transform:uppercase; background-color:#ffffff; border-color:#cccccc; color:#333333; white-space:nowrap; background-color:#4a6785; border-color:#4a6785; color:#ffffff; background-color:#ffffff; border-color:#e4e8ed; color:#4a6785">Not-Escalated</span></td><td class3D"created" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc"><span title3D"10/Jan/20 8:02 PM"><time datetime3D"2020-01-10T20:02:52+0800">10/Jan/20</time></span></td><td class3D"customfield_12120" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc">1-7780891 </td><td class3D"resolution" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc">Unresolved </td><td class3D"assignee" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc"><span class3D"tinylink"><a class3D"user-hover" rel3D"maobrien" id3D"assignee_maobrien" href3D"http://nms-jira.ca.alcatel-lucent.com:8082/secure/ViewProfile.jspa?name3Dmaobrien" style3D"color:#3b73af; text-decoration:none">Matthew O'Brien</a></span></td><td class3D"reporter" style3D"padding:0px; bord
er-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc"><span class3D"tinylink"><a class3D"user-hover" rel3D"jzhu039" id3D"reporter_jzhu039" href3D"http://nms-jira.ca.alcatel-lucent.com:80
82/secure/ViewProfile.jspa?name3Djzhu039" style3D"color:#3b73af; text-decoration:none">John Zhu</a></span></td></tr><tr id3D"issuerow482459" rel3D"482459" class3D"issuerow"><td class3D"issuekey" style3D"padding:0px; border-collapse:co
llapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc"><a class3D"issue-link" href3D"http://nms-jira.ca.alcatel-lucent.com:8082/browse/NSPD-248763" style3D"color:#3b73af; text-decoration:none">NSPD-248
763</a></td><td class3D"summary" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc"><p style3D"margin:10px 0 0 0; margin-top:0; margin:0"><a class3D"issue-link" href3D"http://nms-jira.ca.alcatel-lucent.com:8082/browse/NSPD-248763" style3D"color:#3b73af; text-decoration:none">NFMP Session limit reached</a></p></td><td class3D"status" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc"><span class3D" jira-issue-status-lozenge aui-lozenge jira-issue-status-lozenge-blue-gray jira-issue-status-lozenge-new aui-lozenge-subtle jira-issue-status-lozenge-max-width-medium" bgcolor3D"#ffffff" style3D"background:#cccccc; border:1px solid #cccccc; border-radius:3px; color:#333333; display:inline-block; font-size:11px; font-weight:bold; line-height:99%; margin:0; padding:2px 5px; text-align:center; text-decoration:none; text-transform:uppercase; background-color:#ffffff; border-color:#cccccc; color:#333333; white-space:nowrap; background-color:#4a6785; border-color:#4a6785; color:#ffffff; background-color:#ffffff; border-color:#e4e8ed; color:#4a6785">Not-Escalated</span></td><td class3D"created" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc"><span title3D"13/Dec/19 12:50 PM"><time datetime3D"2019-12-13T12:50:33+0800">13/Dec/19</time></span></td><td class3D"customfield_12120" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc">1-7715722 </td><td class3D"resolution" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc">Resolved </td><td class3D"assignee" style3D"padding:0px; border-collapse:collapse; text-align:left; vertical-align:top; padding:7px; border-top:1px solid #cccccc"><span class3D"tinylink"><a class3D"user-hover" rel3D"vkanadiy" id3D"assignee_vkanadiy" href3D"http://nms-jira.ca.alcatel-lucent.com:8082/secure/ViewProfile.jspa?name3Dvkanadiy" style3D"color:#3b73af; text-decoration:none">Vivek Kanadiya</a></span></td><td class3D"reporter" style3D"padding:0px; border-collapse:collapse;
我用以下命令取出黄色部分的内容:
[root@betactvdh:/tmp/jm/20200112]# grep -oP "(?<=\">)[/ 0-9a-zA-Z().,_-]+(?=(<\/a>)?<\/span> ?<\/td><td class3D\"reporter\")" text.txt
Bin 3LS (Robert Baker)
Vivek Kanadiya
但是发现其中有一个Matthew O'Brien中有一个'所以没有取到,因此在命令中加入'却发现执行出错了。
[root@betactvdh:/tmp/jm/20200112]# grep -oP "(?<=\">)[/ 0-9a-zA-Z().,_-']+(?=(<\/a>)?<\/span> ?<\/td><td class3D\"reporter\")" text.txt
grep: range out of order in character class
0
[root@betactvdh:/tmp/jm/20200112]# grep -oP "(?<=\">)[/ 0-9a-zA-Z().,_-\']+(?=(<\/a>)?<\/span> ?<\/td><td class3D\"reporter\")" text.txt
grep: range out of order in character class
0
[root@betactvdh:/tmp/jm/20200112]#
请问应该如何加这个'呢?

论坛徽章:
7
2016科比退役纪念章
日期:2018-10-24 08:24:0115-16赛季CBA联赛之北控
日期:2019-03-12 14:34:562016科比退役纪念章
日期:2019-04-01 10:33:0915-16赛季CBA联赛之山东
日期:2019-04-17 12:46:3215-16赛季CBA联赛之广夏
日期:2019-05-09 16:40:4015-16赛季CBA联赛之广夏
日期:2019-10-10 15:33:4015-16赛季CBA联赛之辽宁
日期:2019-10-15 08:37:06
发表于 2020-01-12 22:11 |显示全部楼层
之所以报错不在于'  而在于 []里的 - , []里的 -前后有字符的话 表示的是前后字符间的范围,[]里面要匹配-本身要么转义\-,或者写在[]里的最前面或最后面。  
另外/也不需要转义。

评分

参与人数 1可用积分 +10 收起 理由
飘絮絮絮丶 + 10 赞一个!

查看全部评分

论坛徽章:
17
辰龙
日期:2014-05-21 21:01:4115-16赛季CBA联赛之北控
日期:2016-11-28 18:26:3815-16赛季CBA联赛之佛山
日期:2016-11-03 11:18:5815-16赛季CBA联赛之辽宁
日期:2016-07-10 16:09:4115-16赛季CBA联赛之江苏
日期:2016-02-20 23:09:202015亚冠之塔什干棉农
日期:2015-08-17 19:49:492015年亚洲杯之日本
日期:2015-04-30 01:24:342015年亚洲杯之约旦
日期:2015-04-01 00:37:182015年亚洲杯之沙特阿拉伯
日期:2015-03-02 15:55:40处女座
日期:2014-05-25 10:34:0015-16赛季CBA联赛之深圳
日期:2016-12-23 13:51:38
发表于 2020-01-13 08:12 |显示全部楼层
回复 2# cfwyy

非常感谢您的指点!

论坛徽章:
0
发表于 2020-01-13 08:21 |显示全部楼层
本帖最后由 legs 于 2020-01-13 08:23 编辑

就你提供的字符而言,可以这样试一下。
grep -Po '">\K[^>]+(?=<\/a><\/span><\/td><t)' test
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

DTCC2020中国数据库技术大会 限时7.5折

【架构革新 自主可控】2020年6月4日~6日第十一届中国数据库技术大会将在北京隆重召开。

大会设置2大主会场,20+技术专场,将邀请超百位行业专家,重点围绕数据架构、AI与大数据、传统企业数据库实践和国产开源数据库等内容展开分享和探讨,为广大数据领域从业人士提供一场年度盛会和交流平台。

http://dtcc.it168.com


大会官网>>
  

北京盛拓优讯信息技术有限公司. 版权所有 16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122
中国互联网协会会员  联系我们:huangweiwei@it168.com
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP