Chinaunix
标题:
perl 解析一txt文件并画图(问题)
[打印本页]
作者:
biofqq
时间:
2009-09-02 22:13
标题:
perl 解析一txt文件并画图(问题)
文件如下示,是一blast结果,现在想针对每一>提取
cg
|
tg(画出实心圆)
或
cg
||
cg(画出空心圆)。
每一> 绘出一列空心和实心圆
例
>6_1_5
○○○○○○○○○○○(实心未标出)
>6_1_5_
Length = 1231
Score = 365 bits (184), Expect = e-103
Identities = 190/192 (98%)
Strand = Plus / Minus
Query: 1 aatgtttatggtggattttgtaggtgggattaattgtgaatttatagggttggtggggcg 60
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 424 aatgtttatggtggattttgtaggtgggattaattgtgaatttatagggttggtggggcg 365
Query: 61 tgggtgtcgtttgggtgtttgggagaatagggggtgggtagggtaggaggtttgaggggg 120
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 364 tgggtgtcgtttgggtgtttgggagaatagggggtgggtagggtaggaggtttgaggggg 305
Query: 121 gaggagtaggatttattttttaaatttatcgttttgagtcgttggtttttagataggttg 180
||||||||||||||||| ||||||||||||||||||||| ||||||||||||||||||||
Sbjct: 304 gaggagtaggatttattctttaaatttatcgttttgagttgttggtttttagataggttg 245
Query: 181 atttggttggtg 192
||||||||||||
Sbjct: 244 atttggttggtg 233
Score = 52.0 bits (26), Expect = 4e-009
Identities = 26/26 (100%)
Strand = Plus / Minus
Query: 345 cgttattatattgatatgagtgtggg 370
||||||||||||||||||||||||||
Sbjct: 79 cgttattatattgatatgagtgtggg 54
>6_1_4_
Length = 1251
Score = 365 bits (184), Expect = e-103
Identities = 190/192 (98%)
Strand = Plus / Minus
Query: 1 aatgtttatggtggattttgtaggtgggattaattgtgaatttatagggttggtggggcg 60
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 425 aatgtttatggtggattttgtaggtgggattaattgtgaatttatagggttggtggggcg 366
Query: 61 tgggtgtcgtttgggtgtttgggagaatagggggtgggtagggtaggaggtttgaggggg 120
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct: 365 tgggtgtcgtttgggtgtttgggagaatagggggtgggtagggtaggaggtttgaggggg 306
Query: 121 gaggagtaggatttattttttaaatttatcgttttgagtcgttggtttttagataggttg 180
||||||||||||||||||||||||||||| ||||||||| ||||||||||||||||||||
Sbjct: 305 gaggagtaggatttattttttaaatttattgttttgagttgttggtttttagataggttg 246
Query: 181 atttggttggtg 192
||||||||||||
Sbjct: 245 atttggttggtg 234
……
……
作者:
生物信息学
时间:
2009-09-02 23:49
看不明白
作者:
longbow0
时间:
2009-09-03 12:43
提供一个思路。
用 BioPerl 的 Bio::SearchIO 解析 BLAST 结果。
HSP->query_string 就是 BLAST 结果中的 Query 序列;
HPS->hit_string 是 Sbjct 序列。
然后比较这两条序列就可以了。
Bio::SearchIO HOWTO:
http://www.bioperl.org/wiki/HOWTO:SearchIO
作者:
xti9er
时间:
2009-09-03 13:32
正则替换不就完了,有这么复杂吗?
作者:
biofqq
时间:
2009-09-03 20:34
标题:
回复 #3 longbow0 的帖子
包含几百条序列,Bio::SearchIO 解析不可以,初步想法寻找*|,然后寻找它的上行和下行对应的是否是cg,tg。这个怎么表达不知道,还有怎么把每条序列结果分开,最后是怎样绘出svg或png图
欢迎光临 Chinaunix (http://bbs.chinaunix.net/)
Powered by Discuz! X3.2