免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1915 | 回复: 7
打印 上一主题 下一主题

求个正则 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-09-08 18:16 |只看该作者 |倒序浏览
将如下内容,改为:aaa:dsafs/sdafdc/sfdfserd; bbb:sfd sfsd/eqwwer s/ ,即将code提出来当KEY,Name部分作为后面的value。最好用。net的正则,因为想把它用到数据库处理中。

<Code>aaa</Code>
<Name>dsafs</Name>
<Code>aaa</Code>
<Name>sdafdc</Name>
<Code>aaa</Code>
<Name>sfdfserd</Name>
<Code>bbb</Code>
<Name>sfd sfsdf</Name>
<Code>bbb</Code>
<Name>eqwwer s</Name>
<Code>ccc</Code>
<Name> </Name>


py prel都可以的。
现想到的,先找到<Code>.*?<\/Code>如果还能够找得到<Code>.*?<\/Code>那么就匹配上了。

(?'code'<Code>.*?<\/Code>).*?(?(code)<Code>.*?<\/Code>|(?'code'<Code>.*?<\/Code>))



但没有得到想要的。。

论坛徽章:
0
2 [报告]
发表于 2010-09-09 12:27 |只看该作者

自己顶下,麻烦老大们转到perl去吧

论坛徽章:
15
2015年辞旧岁徽章
日期:2015-03-03 16:54:15双鱼座
日期:2015-01-15 17:29:44午马
日期:2015-01-06 17:06:51子鼠
日期:2014-11-24 10:11:13寅虎
日期:2014-08-18 07:10:55酉鸡
日期:2014-04-02 12:24:51双子座
日期:2014-04-02 12:19:44天秤座
日期:2014-03-17 11:43:36亥猪
日期:2014-03-13 08:13:51未羊
日期:2014-03-11 12:42:03白羊座
日期:2013-11-20 10:15:18CU大牛徽章
日期:2013-04-17 11:48:45
3 [报告]
发表于 2010-09-09 12:56 |只看该作者
别移, 这个用shell 练练手也不错。
  1. awk -F"<|>" '{if (a[$3]=="") {a[$3]++;printf "\n%s:",$3;getline;printf $3} else {getline;printf "/%s",$3}}' infile


  2. aaa:dsafs/sdafdc/sfdfserd
  3. bbb:sfd sfsdf/eqwwer s
  4. ccc:
复制代码

论坛徽章:
0
4 [报告]
发表于 2010-09-09 13:05 |只看该作者
perldoc XML::Simple

求职 : 技术支持/维
论坛徽章:
0
5 [报告]
发表于 2010-09-09 13:26 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
6 [报告]
发表于 2010-09-09 14:06 |只看该作者
谢谢各位达达,但上面的shell,看不到用正则的地方呀,perl的脚本,用字典和数据库的的游标效率一样底吧。。下面是上csdn上问到的。



thy38
(孤独的长跑者)
等 级:
2
#6楼 得分:0回复于:2010-09-09 10:59:38
既然来脚本区问,我给你用IronPython写了个:
Python code
from System.Text.RegularExpressions import Regex, RegexOptions

s = r'''<Code>aaa</Code>
<Name>dsafs</Name>
<Code>aaa</Code>
<Name>sdafdc</Name>
<Code>aaa</Code>
<Name>sfdfserd</Name>
<Code>bbb</Code>
<Name>sfd sfsdf</Name>
<Code>bbb</Code>
<Name>eqwwer s</Name>
<Code>ccc</Code>
<Name> </Name>'''

reg = Regex(r"<code>(?<code>(?<!</code>).*)</code>\s+<name>(?<name>(?<!</name>).*)</name>",
                RegexOptions.IgnoreCase);

result = {}
for x in reg.Matches(s):
    key, value = x.Groups['code'].ToString(), x.Groups['name'].ToString()
    try:
        result[key].append(value)
    except KeyError:
        result[key] = [value]

for i in result:
    str = '%s:%s' % (i, '/'.join(result[i]))
    print str


对我有用[0]丢个板砖[0]引用举报管理TOP

budong0000
(budong)
等 级:
#7楼 得分:0回复于:2010-09-09 12:29:30
多谢几位达达,偶这就去测试。我猜想。net的正则和其它脚本的不一样,所以才有上面要求。其实相似就好。
对我有用[0]丢个板砖[0]引用举报管理TOP

budong0000
(budong)
等 级:
#8楼 得分:0回复于:2010-09-09 13:55:10
刚测试好了,可用,但这种用字典再foreach的做法和sql server里的游标效率一样。实在不想这样做。:《


现在想的思路是,匹配(?'code'<code>.*?</code>)如果前面没有(?<!\k'code'.*?)即可,但找出来的仍不正确,附
Perl code
(?<!\k'code'.*?)(?'code'<code>.*?</code>)



用的是Regex Tester测试

论坛徽章:
0
7 [报告]
发表于 2010-09-09 14:20 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
8 [报告]
发表于 2010-09-09 14:27 |只看该作者
有使用  sed 来完成的吗
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP