免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: cxrfly
打印 上一主题 下一主题

[文本处理] 模式匹配的问题求教 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2014-08-03 16:04 |只看该作者
回复 3# 欧阳西风


    谢谢,是的,perl 语言。

类似$ID1=jgi|Physo3|554134|estExt_Genewise1Plus.C_1_t70226,
$ID2=jgi|Physo3|554134|estExt_Genewise1Plus.C_1_t70226这样的字符串如何进行匹配 阿?好像用$ID1=~/$ID2/或者 $ID1==$ID2都不行阿?求指点

论坛徽章:
0
12 [报告]
发表于 2014-08-03 16:10 |只看该作者
回复 9# yinyuemi


    类似$ID1=jgi|Physo3|554134|estExt_Genewise1Plus.C_1_t70226,
$ID2=jgi|Physo3|554134|estExt_Genewise1Plus.C_1_t70226这样的字符串如何进行匹配 阿?假如很多类似的字符串存储在ID1 和ID2,但用$ID1=~/$ID2/或者 $ID1==$ID2都不行阿,求指点

论坛徽章:
2
射手座
日期:2014-10-10 15:59:4715-16赛季CBA联赛之上海
日期:2016-03-03 10:27:14
13 [报告]
发表于 2014-08-03 16:12 |只看该作者
回复 12# cxrfly


    一个道理啊, $ID1 =~ /\Q$ID2\E/ 或者 $ID1 eq $ID2 (字符比较用 eq,数字用 ==)

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
14 [报告]
发表于 2014-08-03 17:28 |只看该作者
回复 8# cxrfly

那不是管道,是或~
   

论坛徽章:
3
天蝎座
日期:2013-12-10 19:37:11酉鸡
日期:2014-08-04 20:05:38双鱼座
日期:2014-08-09 21:53:54
15 [报告]
发表于 2014-08-03 17:37 |只看该作者


回复 12# cxrfly

你可以看一下13楼的答案,那个应该是可以的。
   




回复 9# yinyuemi
我特意去看了一下perl正则的文档(之前基本没怎么学过perl),感觉perl的\Q \E这两个符号挺好用啊,sed和awk好像就没有类似的功能

论坛徽章:
0
16 [报告]
发表于 2014-08-03 17:55 |只看该作者
回复 15# 欧阳西风


    http://bbs.chinaunix.net/thread-4148668-1-1.html,我的帖子在这里,麻烦您指点下

论坛徽章:
0
17 [报告]
发表于 2014-08-03 17:55 |只看该作者
回复 13# yinyuemi


   

    http://bbs.chinaunix.net/thread-4148668-1-1.html,我的帖子在这里,麻烦您指点下

论坛徽章:
3
天蝎座
日期:2013-12-10 19:37:11酉鸡
日期:2014-08-04 20:05:38双鱼座
日期:2014-08-09 21:53:54
18 [报告]
发表于 2014-08-03 18:51 |只看该作者
本帖最后由 欧阳西风 于 2014-08-03 18:54 编辑

回复 16# cxrfly


    原脚本是perl,我不是很熟,所以就不自己写了。边搜索perl的语法,边看了下你的脚本,我觉着问题主要存在几个方面:

1. 你读取a文件时,分隔符"$/"已经变成了">"不再是"\n"了,建议在修改"$/"之前读取a文件(因为文件a应该是相对固定的,我觉着没必要放到while循环中去多次读取,只需要在while之前读取一次获得@ID_file列表就行啦)

2.你之所以没有输出,实际上是if判断eq时不为true,究其原因是$protein_ID结尾有一个"\n",所以判断是一个字符串包含换行符,另外一个不包含,肯定是不相等的了。这个建议将
  1. if ($_=~/(.*\n)/){
复制代码
这一句的\n放到括号外边,即:
  1. if ($_=~/(.*)\n/){
复制代码
3.另外foreach当中的else语句没必要吧,即使加上else我个人觉着也不应该用exit来退出吧?


以上。(本人没怎么学过perl, 不对之处请见谅)
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP