免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2841 | 回复: 4

perl 解析一txt文件并画图(问题) [复制链接]

论坛徽章:
0
发表于 2009-09-02 22:13 |显示全部楼层
文件如下示,是一blast结果,现在想针对每一>提取
cg
|
tg(画出实心圆)

cg
||
cg(画出空心圆)。
每一> 绘出一列空心和实心圆

>6_1_5
○○○○○○○○○○○(实心未标出)
>6_1_5_
          Length = 1231

Score =  365 bits (184), Expect = e-103
Identities = 190/192 (98%)
Strand = Plus / Minus

                                                                       
Query: 1   aatgtttatggtggattttgtaggtgggattaattgtgaatttatagggttggtggggcg 60
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 424 aatgtttatggtggattttgtaggtgggattaattgtgaatttatagggttggtggggcg 365

                                                                       
Query: 61  tgggtgtcgtttgggtgtttgggagaatagggggtgggtagggtaggaggtttgaggggg 120
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 364 tgggtgtcgtttgggtgtttgggagaatagggggtgggtagggtaggaggtttgaggggg 305

                                                                       
Query: 121 gaggagtaggatttattttttaaatttatcgttttgagtcgttggtttttagataggttg 180
           ||||||||||||||||| ||||||||||||||||||||| ||||||||||||||||||||
Sbjct: 304 gaggagtaggatttattctttaaatttatcgttttgagttgttggtttttagataggttg 245

                       
Query: 181 atttggttggtg 192
           ||||||||||||
Sbjct: 244 atttggttggtg 233



Score = 52.0 bits (26), Expect = 4e-009
Identities = 26/26 (100%)
Strand = Plus / Minus

                                    
Query: 345 cgttattatattgatatgagtgtggg 370
           ||||||||||||||||||||||||||
Sbjct: 79  cgttattatattgatatgagtgtggg 54


>6_1_4_
          Length = 1251

Score =  365 bits (184), Expect = e-103
Identities = 190/192 (98%)
Strand = Plus / Minus

                                                                       
Query: 1   aatgtttatggtggattttgtaggtgggattaattgtgaatttatagggttggtggggcg 60
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 425 aatgtttatggtggattttgtaggtgggattaattgtgaatttatagggttggtggggcg 366

                                                                       
Query: 61  tgggtgtcgtttgggtgtttgggagaatagggggtgggtagggtaggaggtttgaggggg 120
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 365 tgggtgtcgtttgggtgtttgggagaatagggggtgggtagggtaggaggtttgaggggg 306

                                                                       
Query: 121 gaggagtaggatttattttttaaatttatcgttttgagtcgttggtttttagataggttg 180
           ||||||||||||||||||||||||||||| ||||||||| ||||||||||||||||||||
Sbjct: 305 gaggagtaggatttattttttaaatttattgttttgagttgttggtttttagataggttg 246

                       
Query: 181 atttggttggtg 192
           ||||||||||||
Sbjct: 245 atttggttggtg 234
……
……

论坛徽章:
0
发表于 2009-09-02 23:49 |显示全部楼层
看不明白

论坛徽章:
0
发表于 2009-09-03 12:43 |显示全部楼层
提供一个思路。

用 BioPerl 的 Bio::SearchIO 解析 BLAST 结果。

HSP->query_string 就是 BLAST 结果中的 Query 序列;
HPS->hit_string 是 Sbjct 序列。

然后比较这两条序列就可以了。


Bio::SearchIO HOWTO:

http://www.bioperl.org/wiki/HOWTO:SearchIO

论坛徽章:
0
发表于 2009-09-03 13:32 |显示全部楼层
正则替换不就完了,有这么复杂吗?

论坛徽章:
0
发表于 2009-09-03 20:34 |显示全部楼层

回复 #3 longbow0 的帖子

包含几百条序列,Bio::SearchIO 解析不可以,初步想法寻找*|,然后寻找它的上行和下行对应的是否是cg,tg。这个怎么表达不知道,还有怎么把每条序列结果分开,最后是怎样绘出svg或png图
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP