免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 6978 | 回复: 26
打印 上一主题 下一主题

求助: 谁有生物基因算法类的书籍推荐 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-09-30 11:11 |只看该作者 |倒序浏览
各位大虾,
      
        本人自己瞎搞了半年一事无成,又回到了perl 的怀抱,最近帮助同学写一个生物基因类的项目,谁有这方面的算法类的书籍介绍,做过生物基因的大虾估计知道,有些题目真不是地球人能想出的,我更是想不出来了。

                                                                             小生有礼了

论坛徽章:
0
2 [报告]
发表于 2010-09-30 11:26 |只看该作者
Beginning perl for bioinformatics
Mastering Perl for Bioinformatics

后者介绍了bioperl包, 发表在genome research上,cpan上有下,不过个人认为不太好用
一般的自己写写就好了

论坛徽章:
0
3 [报告]
发表于 2010-09-30 11:27 |只看该作者
有本叫做生物信息学算法导论的书  还有就是一些测序算法数据 去当当 卓越 上找找看吧

论坛徽章:
0
4 [报告]
发表于 2010-09-30 11:28 |只看该作者
生物信息学算法导论  没看过 只是知道有这么一本书

论坛徽章:
0
5 [报告]
发表于 2010-09-30 12:05 |只看该作者
感谢大家介绍了,先下来看看

论坛徽章:
0
6 [报告]
发表于 2010-09-30 12:09 |只看该作者
回复 2# hufeiyc


    CTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTGTAATACGACTCACTATAGGGCGAATTGGGTACCGGGCCCCCCCTCGAGGTCGACGGTATCGATAAGCTTGATATCGAATTCCTGCAGCCCcaaacacacgctcggacgcatattacacatgttcatacacttaatactcgctgttttgaattgatgttttaggaatatatatgtagagagagcttccttgagtccattcacaggtcgtgatatgattcaattagcttccgactcattcatccaaataccgagtcgccaaaattcaaactagactcgttaaatgaatgaatgatgcggtagacaaattggatcattgattctctttgattggactgaagggagctccctctctcttttgtattccaattttcttgattaatctttcctgcacaaaaacatgcttgatccactaagtgacatatatgctgccttcgtatatatagttctggtaaaattaacattttgggtttatctttatttaaggcatcgccatgGGGGGATCCACTAGTTCTAGAGCGGCCGCCACCGCGGTGGAGCTCCAGCTTTTGTTCCCTTTAGTGAGGGTTAATTCCGAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGC

就是这样的一段序列,看里面有没有回文结构

回文结构就是 AT匹配 GC匹配,不分大小写。中间可以跳跃,跳跃算是“突起”,要找最长的。

这个算是一条链,最简单的,您有时间帮忙看看。

论坛徽章:
0
7 [报告]
发表于 2010-09-30 12:45 |只看该作者
回复 6# dahe_1984


    回文结构就是 AT匹配 GC匹配,不分大小写。中间可以跳跃,跳跃算是“突起”,要找最长的
   这句不太懂,是指链中出现AT和GC么,跳跃是值被哪两个字符包围的部分呢,能不能解释的详细一点,毕竟不是学生物的。

论坛徽章:
0
8 [报告]
发表于 2010-09-30 12:55 |只看该作者
AAAAAAATTTTTTT  最理想的回文结构,全匹配
AAAAAAAGTTTTTTT G算是里面的突起,可以跳过

论坛徽章:
0
9 [报告]
发表于 2010-09-30 12:57 |只看该作者
TTTTTTTAAAAAAA呢
GGGGCCCC也是么

论坛徽章:
7
巳蛇
日期:2014-04-10 08:54:57白羊座
日期:2014-04-22 20:06:262015年亚洲杯之沙特阿拉伯
日期:2015-02-10 14:18:532015年辞旧岁徽章
日期:2015-03-03 16:54:152015亚冠之吉达阿赫利
日期:2015-06-02 11:34:112015亚冠之武里南联
日期:2015-06-24 12:13:082015亚冠之阿尔纳斯尔
日期:2015-08-03 09:08:25
10 [报告]
发表于 2010-09-30 12:59 |只看该作者
回复 7# 珞水的大叔
科普一下:
因为 DNA 是双链结构,我们都知道 DNA 由 4 种碱基构成,它们分别是 A,T,C,G。DNA 的双链结构是由碱基互补配对原则构成的,配对原则是 A <=> T,C <=> G。
因此,一般的写法:
ATCGAT,其实表示的是
ATCGAT
TAGCTA
这条序列上面的部分正好和下面的部分反过来写是一样的,这样的结构就叫回文结构。
不知道我说清楚了没有。
不过,我现在很忙,楼主的问题,我就不给具体脚本了。只给个我想的思路:
把序列反向互补(就是先反向,再根据碱基配对原则互补),然后,与原序列比较,查找最长相同子串。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP