免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1889 | 回复: 7
打印 上一主题 下一主题

求助:这样的程序该怎么写?新手求教[已解决] [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2010-04-01 15:46 |只看该作者 |倒序浏览
本帖最后由 yn521yn 于 2010-04-09 09:41 编辑

>sp|P35354|PGH2_HUMAN Prostaglandin G/H synthase 2 OS=Homo sapiens GN=PTGS2 PE=
Length=604
                    10        20        30        40        50
PredSS       aaaaaaaaaaaa                bbbbbb  bbbbb      
AA seq     MLARALLLCAVLALSHTANPCCSHPCQNRGVCMSVGFDQYKCDCTRTGFY
ProbA                                                        
ProbB                                                        
                    60        70        80        90       100
PredSS           aaaaaaaaaa       bbbbbb       aaaa aaaaaaaaa
AA seq     GENCSTPEFLTRIKLFLKPTPNTVHYILTHFKGFWNVVNNIPFLRNAIMS
ProbA                                                        
ProbB                                                        
                   110       120       130       140       150
PredSS     aaaaa                   aaaaaaa                  
AA seq     YVLTSRSHLIDSPPTYNADYGYKSWEAFSNLSYYTRALPPVPDDCPTPLG
ProbA                                                        
ProbB                                                                                                            
>sp|Q02127|PYRD_HUMAN Dihydroorotate dehydrogenase, mitochondrial OS=Homo sapie
Length=395
                    10        20        30        40        50
PredSS       aaaaaaa   bbbbb   aaaaaaaaaaa  aaaaaaaaaaaa     
AA seq     MAWRHLKKRAQDAVIILGGGGLLFASYLMATGDERFYAEHLMPTLQGLLD
ProbA                                                        
ProbB                                                        
                    60        70        80        90       100
PredSS     aaaaaaaaaaaaaa            bbbbbb        bbbbbbb   
AA seq     PESAHRLAVRFTSLGLLPRARFQDSDMLEVRVLGHKFRNPVGIAAGFDKH
ProbA                                                        
ProbB                                                        
                   110       120       130       140       150
PredSS     aaaaaaaaaa  bbbbb              bbbbbaaa bbbb      
AA seq     GEAVDGLYKMGFGFVEIGSVTPKPQEGNPRPRVFRLPEDQAVINRYGFNS
ProbA                                                        
ProbB                                                        
数据格式如上,是2个蛋白序列的二级结构预测结果,现在我想得到每个序列的预测结果中有多少个a,多少个b,就是PredSS这行,应如何编写程序呢?
向大家求助,先谢谢啦!

论坛徽章:
78
双子座
日期:2013-10-15 08:50:09天秤座
日期:2013-10-16 18:02:08白羊座
日期:2013-10-18 13:35:33天蝎座
日期:2013-10-18 13:37:06狮子座
日期:2013-10-18 13:40:31双子座
日期:2013-10-22 13:58:42戌狗
日期:2013-10-22 18:50:04CU十二周年纪念徽章
日期:2013-10-24 15:41:34巨蟹座
日期:2013-10-24 17:14:56处女座
日期:2013-10-24 17:15:30双子座
日期:2013-10-25 13:49:39午马
日期:2013-10-28 15:02:15
2 [报告]
发表于 2010-04-01 16:02 |只看该作者
每个PredSS所在行的a和b加起来?aaa和a没区别吧?

论坛徽章:
0
3 [报告]
发表于 2010-04-01 16:03 |只看该作者
是什么程序的输出结果?

论坛徽章:
0
4 [报告]
发表于 2010-04-01 16:18 |只看该作者
回复 2# yybmsrs


    aaa就计算成3个a,a就是1个a,要求得到的就是1个蛋白里面有几个a,几个b

论坛徽章:
0
5 [报告]
发表于 2010-04-01 16:19 |只看该作者
回复 3# longbow0


    是预测蛋白质二级结构的在线软件,PSS Finder

论坛徽章:
0
6 [报告]
发表于 2010-04-01 16:40 |只看该作者
累加值??
>sp|P35354|PGH2_HUMAN Prostaglandin G/H synthase 2 OS=Homo sapiens GN=PTGS2 PE=
Length=604
这个下,三行中的 Press 所有a b 的个数 ?

论坛徽章:
0
7 [报告]
发表于 2010-04-01 17:09 |只看该作者

  1. [symphony@archlinux p]$ cat sumab.pl
  2. #!/usr/bin/perl -w
  3. use strict;
  4. my $name;
  5. my %hash;
  6. my %a;
  7. my %b;
  8. while (<>) {
  9.         chomp;
  10.         $name = [        DISCUZ_CODE_0        ] if /^>sp.*/;
  11.         $hash{$name} .= $1 if /PredSS\s+(.*)$/;
  12. }
  13. foreach (keys %hash){
  14.         my @tmp = ();
  15.         @tmp = $hash{$_} =~ /(a)/g;
  16.         $a{$_} =  @tmp;
  17.         @tmp = ();
  18.         @tmp = $hash{$_} =~ /(b)/g;
  19.         $b{$_} =  @tmp;
  20.         print $_,"\nhas a:",$a{$_},"\nhas b:",$b{$_},"\n";
  21.         }
复制代码

  1. [symphony@archlinux p]$ cat data
  2. >sp|P35354|PGH2_HUMAN Prostaglandin G/H synthase 2 OS=Homo sapiens GN=PTGS2 PE=
  3. Length=604
  4. 10        20        30        40        50
  5. PredSS       aaaaaaaaaaaa                bbbbbb  bbbbb
  6. AA seq     MLARALLLCAVLALSHTANPCCSHPCQNRGVCMSVGFDQYKCDCTRTGFY
  7. ProbA
  8. ProbB
  9. 60        70        80        90       100
  10. PredSS           aaaaaaaaaa       bbbbbb       aaaa aaaaaaaaa
  11. AA seq     GENCSTPEFLTRIKLFLKPTPNTVHYILTHFKGFWNVVNNIPFLRNAIMS
  12. ProbA
  13. ProbB
  14. 110       120       130       140       150
  15. PredSS     aaaaa                   aaaaaaa
  16. AA seq     YVLTSRSHLIDSPPTYNADYGYKSWEAFSNLSYYTRALPPVPDDCPTPLG
  17. ProbA
  18. ProbB
  19. >sp|Q02127|PYRD_HUMAN Dihydroorotate dehydrogenase, mitochondrial OS=Homo sapie
  20. Length=395
  21. 10        20        30        40        50
  22. PredSS       aaaaaaa   bbbbb   aaaaaaaaaaa  aaaaaaaaaaaa
  23. AA seq     MAWRHLKKRAQDAVIILGGGGLLFASYLMATGDERFYAEHLMPTLQGLLD
  24. ProbA
  25. ProbB
  26. 60        70        80        90       100
  27. PredSS     aaaaaaaaaaaaaa            bbbbbb        bbbbbbb
  28. AA seq     PESAHRLAVRFTSLGLLPRARFQDSDMLEVRVLGHKFRNPVGIAAGFDKH
  29. ProbA
  30. ProbB
  31. 110       120       130       140       150
  32. PredSS     aaaaaaaaaa  bbbbb              bbbbbaaa bbbb
  33. AA seq     GEAVDGLYKMGFGFVEIGSVTPKPQEGNPRPRVFRLPEDQAVINRYGFNS
  34. ProbA
  35. ProbB

复制代码

  1. [symphony@archlinux p]$ ./sumab.pl data
  2. >sp|Q02127|PYRD_HUMAN Dihydroorotate dehydrogenase, mitochondrial OS=Homo sapie
  3. has a:57
  4. has b:32
  5. >sp|P35354|PGH2_HUMAN Prostaglandin G/H synthase 2 OS=Homo sapiens GN=PTGS2 PE=
  6. has a:47
  7. has b:17


复制代码

论坛徽章:
0
8 [报告]
发表于 2010-04-09 09:43 |只看该作者
谢谢大家,特别是nuclearxin,问题已经解决啦!
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP