免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: L_WC
打印 上一主题 下一主题

匹配ul之间的内容(包括ul tag) [复制链接]

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
11 [报告]
发表于 2016-08-01 17:26 |只看该作者
回复 10# L_WC

$ cat FILE
<html><ul><ul><li>x</li><li>y</li></ul></ul><p>xxxxxxx</p><ul>zzzz</ul></html>

$ perl -0 -ne '{$x.=$1 while(m{(<ul>(?:(?!<ul>).*?|(?1))*</ul>)}gs);print "$x\n"}' FILE
<ul><ul><li>x</li><li>y</li></ul></ul><ul>zzzz</ul>

   

评分

参与人数 1信誉积分 +10 收起 理由
sunzhiguolu + 10 无敌了!!!

查看全部评分

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
12 [报告]
发表于 2016-08-01 20:25 |只看该作者
  1. cat f
复制代码
<html><ul><ul><li>x</li><li>y</li></ul></ul><p>xxxxxxx</p><ul>zzzz</ul></html>
  1. perl -pe '$_=join("",m~(<ul>(?:(?!</?ul>).|<ul>.*?</ul>)*</ul>)~gs)' f
复制代码
<ul><ul><li>x</li><li>y</li></ul></ul><ul>zzzz</ul>

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
13 [报告]
发表于 2016-08-01 20:31 |只看该作者
回复 11# jason680
大神, 这种写法 能匹配何种格式的 ul 标签, 您老能否科普下 一点不懂啊.

   

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
14 [报告]
发表于 2016-08-01 20:34 |只看该作者
回复 13# sunzhiguolu

>> ...能匹配何种格式的 ul 标签, ...

那种不能匹配?
   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
15 [报告]
发表于 2016-08-01 20:57 |只看该作者
本帖最后由 sunzhiguolu 于 2016-08-01 21:02 编辑

回复 14# jason680
这个是啥功能, 连嵌套的 ul 都不放过? 大神能否给个参考, 我那个好像不好使啊!!!
比如像这样的:
  1. <html>
  2.     <head>
  3.     <title>Match ul Label</title>
  4.     </head>
  5.     <body>
  6.         <ul>
  7.             <li>A1</li>
  8.             <li>A2</li>
  9.             <li>
  10.                 <ul>
  11.                     <li>A1-1</li>
  12.                     <li>A2-1</li>
  13.                 </ul>
  14.             </li>
  15.         </ul>
  16.         <p>Hello, CU</p>
  17.         <ul>
  18.             <li>
  19.                 <ul>
  20.                     <li>
  21.                         <ol>
  22.                             <li>
  23.                                 <ul>
  24.                                     <li>Inner Item</li>
  25.                                 </ul>
  26.                             </li>
  27.                         </ol>
  28.                     </li>
  29.                     <li>B2</li>
  30.                 </ul>
  31.             </li>
  32.         </ul>
  33.     </body>
  34. </html>
复制代码

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
16 [报告]
发表于 2016-08-01 21:14 |只看该作者
哪位大神了解情况, 给小菜鸟说道说道, 借楼主的宝地 寻求下帮助, 先谢谢大家了...

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
17 [报告]
发表于 2016-08-01 21:20 |只看该作者
回复 15# sunzhiguolu

$ perldoc perlre
....
/Recurese      <=== search Recurse
                                 (?2)          # Recurse to start of paren group 2
...
              the output produced should be the following:

                  $1 = foo(bar(baz)+baz(bop))
                  $2 = (bar(baz)+baz(bop))
                  $3 = bar(baz)+baz(bop)
...



$ perl -0 -ne '{while(m{(<ul>(?:(?!<ul>).*?|(?1))*</ul>)}gs){print "$1\n*****************************\n"}}' FILE
<ul>
            <li>A1</li>
            <li>A2</li>
            <li>
                <ul>
                    <li>A1-1</li>
                    <li>A2-1</li>
                </ul>
            </li>
        </ul>
*****************************
<ul>
            <li>
                <ul>
                    <li>
                        <ol>
                            <li>
                                <ul>
                                    <li>Inner Item</li>
                                </ul>
                            </li>
                        </ol>
                    </li>
                    <li>B2</li>
                </ul>
            </li>
        </ul>
*****************************

   

评分

参与人数 1信誉积分 +10 收起 理由
sunzhiguolu + 10 正则还有这功能, 太屌了!!!

查看全部评分

论坛徽章:
0
18 [报告]
发表于 2016-08-02 09:33 |只看该作者
回复 16# sunzhiguolu

停车收费         
   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
19 [报告]
发表于 2016-08-03 18:37 |只看该作者
本帖最后由 sunzhiguolu 于 2016-08-03 19:29 编辑

回复 7# jason680
如果想了解下 -00, -01 参数表示具体含义 如何查询,谢谢大神。


大神, 有没有更加详细一点的参考. (中文的话 就更完美了) 谢谢您!

大师, L_WC 借你宝地再停回车 车费一块算 谢谢!

   

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
20 [报告]
发表于 2016-08-03 22:19 |只看该作者
谢谢 jason680 大神, 似乎有点开窍,

借楼主宝地再次停车, 哈哈哈...
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP