免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 6490 | 回复: 10
打印 上一主题 下一主题

[文本处理] [正则]又一个跨行匹配问题? [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-08-12 17:58 |只看该作者 |倒序浏览
本帖最后由 peterdocter 于 2013-08-13 09:41 编辑

dog
<h2>
<sup>1</sup>dog</h2>
<a href="sound://dog00002.spx"><img align="absmiddle" border="0" src="/webster2012_audio.gif"></a>
<a href="sound://dog00001.spx"><img align="absmiddle" border="0" src="/webster2012_audio.gif"></a> <span class="main-fl"> <em >noun,</em>  </span>
<span class="usg"> <em >often attributive</em> </span>
<span  class="pr">\<span class="unicode">ˈ</span>d<span class="unicode">ȯ</span>g, <span class="unicode">ˈ</span>d&auml;g\</span>
<h2 class="def-header">
<span>Definition:
</span>
</h2>
1526
</>

要实现这样的效果?
*dog*
<h2>
<sup>1</sup>dog</h2>
<a href="sound://dog00002.spx"><img align="absmiddle" border="0" src="/webster2012_audio.gif"></a>
<a href="sound://dog00001.spx"><img align="absmiddle" border="0" src="/webster2012_audio.gif"></a> <span class="main-fl"> <em >noun,</em>  </span>
<span class="usg"> <em >often attributive</em> </span>
<span  class="pr">\<span class="unicode">ˈ</span>d<span class="unicode">ȯ</span>g, <span class="unicode">ˈ</span>d&auml;g\</span>
<h2 class="def-header">
<span>Definition:
</span>
</h2>
1526
</>

dog是变化,下行<h2>是固定!
如何用sed实现这样的跨行效果?
这样的表示清楚了吧?
再上传比较完成demo,提供给前辈们测试吧!
要求就是以像dog开头,然后遇到首个<h2>就进行替换成*dog*;结束是</>
demo.rar (5.25 KB, 下载次数: 11)

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
2 [报告]
发表于 2013-08-12 20:30 |只看该作者
楼主这表达,让人捉急.......

论坛徽章:
0
3 [报告]
发表于 2013-08-12 22:07 |只看该作者
回复 2# 关阴月飞

请再看一下!

论坛徽章:
0
4 [报告]
发表于 2013-08-12 23:36 |只看该作者
  1. sed -e 'N' -e 's/\(.*\)\(\n<h2>\)/*\1*\2/g' file
复制代码

论坛徽章:
0
5 [报告]
发表于 2013-08-13 07:08 |只看该作者
回复 4# h2ero

多谢!测试一下,没有什么效果...
   

论坛徽章:
0
6 [报告]
发表于 2013-08-13 09:23 |只看该作者
  1. sed -n 'N;/<h2>/{s/\(.*\)\n/*\1*\n/;p};/<h2>/d;p' file
复制代码
写的不专业,看看怎么改下

论坛徽章:
0
7 [报告]
发表于 2013-08-13 09:41 |只看该作者
回复 6# ttt4011

多谢!不过没有想要效果。而且上传一个比较完整demo附件,请前辈有空再指导!
   

论坛徽章:
0
8 [报告]
发表于 2013-08-13 10:20 |只看该作者

  1. {
  2. if(NR==FNR)
  3. {
  4.    if(/<h2>/) a[FNR-1];
  5. }
  6. else
  7. {
  8.    if(FNR in a)
  9.       print"*"$0"*";
  10.     else
  11.       print;
  12.    }
  13. }
复制代码
执行:awk -f test  ufile ufile
  文件test内容是上面那段代码

论坛徽章:
0
9 [报告]
发表于 2013-08-13 10:29 |只看该作者
本帖最后由 peterdocter 于 2013-08-13 10:35 编辑

回复 8# ttt4011

这个是awk?多谢不过还没有效果?
D:\webster>awk -f key.awk demo.txt

D:\webster>什么都没有?
GNU Awk 3.1.6

{
if(NR==FNR)
{
   if(/<h2>/) a[FNR-1];
}
else
{
   print 1;
   if(FNR in a)
      print"*"$0"*";
    else
      print;
      
   }
}

else一直没有工作?

论坛徽章:
0
10 [报告]
发表于 2013-08-13 10:38 |只看该作者
那后面文件名有两次。回复 9# peterdocter


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP