Chinaunix

标题: perl 解析一txt文件并画图(问题) [打印本页]

作者: biofqq    时间: 2009-09-02 22:13
标题: perl 解析一txt文件并画图(问题)
文件如下示,是一blast结果,现在想针对每一>提取
cg
|
tg(画出实心圆)

cg
||
cg(画出空心圆)。
每一> 绘出一列空心和实心圆

>6_1_5
○○○○○○○○○○○(实心未标出)
>6_1_5_
          Length = 1231

Score =  365 bits (184), Expect = e-103
Identities = 190/192 (98%)
Strand = Plus / Minus

                                                                       
Query: 1   aatgtttatggtggattttgtaggtgggattaattgtgaatttatagggttggtggggcg 60
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 424 aatgtttatggtggattttgtaggtgggattaattgtgaatttatagggttggtggggcg 365

                                                                       
Query: 61  tgggtgtcgtttgggtgtttgggagaatagggggtgggtagggtaggaggtttgaggggg 120
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 364 tgggtgtcgtttgggtgtttgggagaatagggggtgggtagggtaggaggtttgaggggg 305

                                                                       
Query: 121 gaggagtaggatttattttttaaatttatcgttttgagtcgttggtttttagataggttg 180
           ||||||||||||||||| ||||||||||||||||||||| ||||||||||||||||||||
Sbjct: 304 gaggagtaggatttattctttaaatttatcgttttgagttgttggtttttagataggttg 245

                       
Query: 181 atttggttggtg 192
           ||||||||||||
Sbjct: 244 atttggttggtg 233



Score = 52.0 bits (26), Expect = 4e-009
Identities = 26/26 (100%)
Strand = Plus / Minus

                                    
Query: 345 cgttattatattgatatgagtgtggg 370
           ||||||||||||||||||||||||||
Sbjct: 79  cgttattatattgatatgagtgtggg 54


>6_1_4_
          Length = 1251

Score =  365 bits (184), Expect = e-103
Identities = 190/192 (98%)
Strand = Plus / Minus

                                                                       
Query: 1   aatgtttatggtggattttgtaggtgggattaattgtgaatttatagggttggtggggcg 60
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 425 aatgtttatggtggattttgtaggtgggattaattgtgaatttatagggttggtggggcg 366

                                                                       
Query: 61  tgggtgtcgtttgggtgtttgggagaatagggggtgggtagggtaggaggtttgaggggg 120
           ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 365 tgggtgtcgtttgggtgtttgggagaatagggggtgggtagggtaggaggtttgaggggg 306

                                                                       
Query: 121 gaggagtaggatttattttttaaatttatcgttttgagtcgttggtttttagataggttg 180
           ||||||||||||||||||||||||||||| ||||||||| ||||||||||||||||||||
Sbjct: 305 gaggagtaggatttattttttaaatttattgttttgagttgttggtttttagataggttg 246

                       
Query: 181 atttggttggtg 192
           ||||||||||||
Sbjct: 245 atttggttggtg 234
……
……
作者: 生物信息学    时间: 2009-09-02 23:49
看不明白
作者: longbow0    时间: 2009-09-03 12:43
提供一个思路。

用 BioPerl 的 Bio::SearchIO 解析 BLAST 结果。

HSP->query_string 就是 BLAST 结果中的 Query 序列;
HPS->hit_string 是 Sbjct 序列。

然后比较这两条序列就可以了。


Bio::SearchIO HOWTO:

http://www.bioperl.org/wiki/HOWTO:SearchIO
作者: xti9er    时间: 2009-09-03 13:32
正则替换不就完了,有这么复杂吗?
作者: biofqq    时间: 2009-09-03 20:34
标题: 回复 #3 longbow0 的帖子
包含几百条序列,Bio::SearchIO 解析不可以,初步想法寻找*|,然后寻找它的上行和下行对应的是否是cg,tg。这个怎么表达不知道,还有怎么把每条序列结果分开,最后是怎样绘出svg或png图




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2