免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 4272 | 回复: 11
打印 上一主题 下一主题

PERL取字问题,难,求高手拔刀相助!!! [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-06-08 10:47 |只看该作者 |倒序浏览
文本a.txt里有这些字:渝
                    就
                    佔
                    了
                    文
                    廣
                    局
                    不
                    完
                    新
现文本b.txt里有几句话:
在當前國家確定的重慶都市12個歷史文化風貌片區中,渝中區就佔了7個,其中包括上清寺、七星崗解放東路等。而據渝中區文廣局不完全統計,轄區危舊房改造片區,約有120多處歷史文化遺產藏身于其中,像重慶談判舊址怡園、謝家老院子、巴縣衙門舊址等一批新珍貴文物建築均。
首批将开16家社区店,一年内,社区店将达到30-50家,三年内将开出100家社区店。家之家厨电卖场董事长李勇介绍,家之家最大的特点在于采用全新的经营服务模式———以中心
现要用perl程序将在b.txt出现的a.txt里的字,取其前后连续的2个字,3个字,4个字,5个字,然后判断取出的中是否含有标点符号,含有标点符号的就不要,不含有标点符号的就输出。
例如:渝->需要找出是 [中,]  [區中,]  [片區中,]  [貌片區中,]  [中區]  [中區就]  [中區就佔]  [中區就佔了]
其中前面4个含有标点符号,不符合舍弃;所以最终输出的结果为 [中區]  [中區就]  [中區就佔]  [中區就佔了](为了方便大家理解,我加了个[]号)

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
2 [报告]
发表于 2009-06-08 11:38 |只看该作者
将 a.txt 中的每行作为一个 pattern 在 b.txt 中进行如下方式的匹配 m/(.{5})pattern(.{5})/; 对匹配获取的 $1 和 $2 的结果进行判断(是否有标点符号)并输出,然后分别去掉他们开头的一个字,再判断并输出,如此循环,直到 $1, $2 中只剩一个字为止。

[ 本帖最后由 MMMIX 于 2009-6-10 10:44 编辑 ]

论坛徽章:
0
3 [报告]
发表于 2009-06-10 09:48 |只看该作者
不太明白哦,楼上的能说清楚点吗?
能留下代码更好,谢!

论坛徽章:
0
4 [报告]
发表于 2009-06-10 09:51 |只看该作者
补充一点,“现文本b.txt里有几句话:”,其实文本里有很多行,我这里只列举了2行。

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
5 [报告]
发表于 2009-06-10 10:45 |只看该作者
原帖由 clustertech 于 2009-6-10 09:48 发表
不太明白哦,楼上的能说清楚点吗?

嗯,我修改了下,这下更通顺了。

论坛徽章:
0
6 [报告]
发表于 2009-06-10 10:49 |只看该作者
你能把代码上传下吗?

论坛徽章:
0
7 [报告]
发表于 2009-06-10 10:50 |只看该作者
原帖由 MMMIX 于 2009-6-10 10:45 发表

嗯,我修改了下,这下更通顺了。

你能把代码上传下吗?
你这样说我看不懂哦。

论坛徽章:
95
程序设计版块每日发帖之星
日期:2015-09-05 06:20:00程序设计版块每日发帖之星
日期:2015-09-17 06:20:00程序设计版块每日发帖之星
日期:2015-09-18 06:20:002015亚冠之阿尔艾因
日期:2015-09-18 10:35:08月度论坛发贴之星
日期:2015-09-30 22:25:002015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39程序设计版块每日发帖之星
日期:2015-10-05 06:20:00每日论坛发贴之星
日期:2015-10-05 06:20:002015年亚冠纪念徽章
日期:2015-10-06 10:06:482015亚冠之塔什干棉农
日期:2015-10-19 19:43:35程序设计版块每日发帖之星
日期:2015-10-21 06:20:00每日论坛发贴之星
日期:2015-09-14 06:20:00
8 [报告]
发表于 2009-06-10 10:56 |只看该作者
原帖由 clustertech 于 2009-6-10 10:50 发表

你能把代码上传下吗?

不能。

论坛徽章:
0
9 [报告]
发表于 2009-06-10 11:12 |只看该作者
原帖由 MMMIX 于 2009-6-10 10:56 发表

不能。

为什么啊?
  如果这里不好上传,要不你发到我的邮箱里吧,fyazhang@gmail.com
   不甚感谢!!!

论坛徽章:
0
10 [报告]
发表于 2009-06-10 11:14 |只看该作者

回复 #8 MMMIX 的帖子

这个里面如何判断是标准符号?还有中文字符不是.{2}么?你这里为什么是取的.{5}?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP