免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1717 | 回复: 2
打印 上一主题 下一主题

大家帮忙给点perl编程思路解决生物信息问题, [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2004-09-08 00:02 |只看该作者 |倒序浏览
要求写个program,对一个叫OGG1.txt的文件进行分析,能输出如下的类似结果:
运行base.pl, 输出如下:
LOCUS: NM_0168260
GI: 8670535
A: 12.78%
C: 26.92%
G: 27.18%
T: 22.10%
。。。。。

OGG1.txt文件内容如下:
LOCUS  NM_016826    1909 bp    mRNA     PRI  03-FEB-2001
ACCESSION   NM_016826
VERSION     NM_016826.1  GI:8670535
KEYWORDS    .
FEATURES             Location/Qualifiers
     source          1..1909
                     /organism="Homo sapiens"
                     /db_xref="taxon:9606"
                     
     gene            1..1909
                     /gene="OGG1"
                     /note="HMMH; HOGG1; OGH1; MUTM"
                     
     CDS             318..1391
                     /gene="OGG1"
                     /protein_id="NP_058434.1"
                     /db_xref="GI:8670536"
                     /translation="MPARALLPRRMGHRTLASTPALWASIPCPRSELRLDLVLPSGQS
                     FRWREQSPAHWSGVLADQVWTLTQTEEQLHCTVYRGDKSQASRPTPDELEAVRKYFQL
                     misc_feature    732..1094
                     /note="HhH-GPD; Region: HhH-GPD superfamily base excision
                     DNA repair protein"
polyA_site      1884

BASE COUNT      454 a    514 c    519 g    422 t

ORIGIN      
      1 ccctggagaa cccagaagaa cacagctgtg cgcgcccaca ggctctgggg gcgggagaag
       61 ataagtcgca aggagggggc gggacctaca cctcaggaaa gccggagaat tggggtacga
      121 agcggggctt tgatgacccg caaagggcga ggcatgcagg aggtggagga attaagtgaa
      181 acagggaagg ttgttaaaca gcaccgtgtg ggcgaggcct taagggtcgt ggtccttgtc
      241 tgggcggggt ctttgggcgt cgacgaggcc tggttctggg taggcggggc tactacgggg
      301 cggtgcctgc tgtggaaatg cctgcccgcg cgcttctgcc caggcgcatg gggcatcgta
      361 ctctagcctc cactcctgcc ctgtgggcct ccatcccgtg ccctcgctct gagctgcgcc
//(然后又是另一条LOCUS的开始了,偶没有全部拷贝下来,反正格式和前一条一样)
LOCUS       NM_016827    1727 bp    mRNA            PRI       03-FEB-2001
DEFINITION  Homo sapiens 8-oxoguanine DNA glycosylase (OGG1), nuclear gene
            encoding mitochondrial protein, transcript variant 2c, mRNA.
ACCESSION   NM_016827
VERSION     NM_016827.1  GI:8670537

论坛徽章:
0
2 [报告]
发表于 2004-09-09 09:24 |只看该作者

大家帮忙给点perl编程思路解决生物信息问题,

你这个是GenBank文件吧。思路很easy。匹配/db_xref得到GI匹配BASE COUNT得到ACGT的%。再算比例就行了

论坛徽章:
0
3 [报告]
发表于 2004-09-09 11:39 |只看该作者

大家帮忙给点perl编程思路解决生物信息问题,

你抽出ACGT的百分比打算干什么?我对你的目的感兴趣。望赐教!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP