免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: juzi1114
打印 上一主题 下一主题

如何提取介于某个区间的几行文字,区间的开始和结束可以用正则表达式描述 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2008-06-20 13:21 |只看该作者

回复 #2 flw 的帖子

谢谢啦 真的要加油学习了.. 呵呵..

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
12 [报告]
发表于 2008-06-20 13:27 |只看该作者
原帖由 flw 于 2008-6-20 13:13 发表

range operator 有一个内置的 state,相当于你的 $key,不过由它自己来维护,因此可读性更好。


恩,老大的方法确实非常优雅。但 ?! 这种东西,不是只读过一遍小骆驼的我所能理解的,呵呵。

论坛徽章:
0
13 [报告]
发表于 2008-06-20 16:12 |只看该作者

回复 #1 juzi1114 的帖子

Another way is to use $/ ($INPUT_RECORD_SEPARATOR).
Because your data structure is typically with beginning of "CC   -!-" terminated,
using $/ = "CC   -!-" to seperate the records and to store then in each element of an array.
Then processing array's element to get what you want.
Sample code:
$/ = "CC   -!-";
my @data = ();
while (<DATA>) {
    chomp;
    push @data, $_ if $_ ne '';
}

__DATA__
CC   -!- FUNCTION: Rapidly .
CC   -!- CATALYTIC ACTIVITY: Acetylcholine.
CC   -!- SUBUNIT: Homotetramer; composed .
CC       Interacts with PRIMA1.
CC       anchor it to the basal
CC       (By similarity).
CC   -!- SUBCELLULAR LOCATION: Cell junction, synapse. Secreted (By
CC       similarity). Cell membrane; Peripheral membrane protein (By
CC       similarity).
CC   -!- SUBCELLULAR LOCATION: Isoform 2: Cell membrane;
CC       anchor; Extracellular side (By similarity).
CC   -!- ALTERNATIVE PRODUCTS:
CC       Event=Alternative splicing; Named isoforms=2;

论坛徽章:
0
14 [报告]
发表于 2008-06-20 16:48 |只看该作者

回复 #13 ulmer 的帖子

thanks very much!

论坛徽章:
1
2015年辞旧岁徽章
日期:2015-03-03 16:54:15
15 [报告]
发表于 2008-06-20 16:59 |只看该作者
原帖由 ly5066113 于 2008-6-20 13:27 发表

恩,老大的方法确实非常优雅。但 ?! 这种东西,不是只读过一遍小骆驼的我所能理解的,呵呵。

?! 是这个问题特有的,和 range operator 倒没什么关系。
因此并不是总需要用到 ?!,而 range operator 用来解决这一类问题确实很方便。

论坛徽章:
0
16 [报告]
发表于 2008-06-20 17:34 |只看该作者
原帖由 flw 于 2008-6-20 12:13 发表
$start 表示开始标记的模式,$end 表示结束标记的模式,
if ( (/$start/ .. /$end/) and !/$end/ ){
表示需要开始和结束之间的,但不需要结束的那一行。

斑竹的方法确实不错,学习ing!~...

论坛徽章:
0
17 [报告]
发表于 2008-06-27 16:18 |只看该作者
我用了下,发现个需要注意的:
如果$start匹配了,而$end没有匹配,那么它会一直匹配到底。
这样的话就不好玩了。不过现在想想还是比较合理的。
但是第一次使用的时候没注意,还以为perl有问题呢....

论坛徽章:
0
18 [报告]
发表于 2008-09-03 23:42 |只看该作者
原帖由 flw 于 2008-6-20 13:13 发表

range operator 有一个内置的 state,相当于你的 $key,不过由它自己来维护,因此可读性更好。

版主能不能把这个也写一下,供大家学习一下,谢了。。。。
yangfengwait 该用户已被删除
19 [报告]
发表于 2008-09-04 09:01 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
0
20 [报告]
发表于 2008-09-10 10:59 |只看该作者
这个好,真没想到 .. 操作符 还有这用。

多谢,多谢。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP