免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3192 | 回复: 4
打印 上一主题 下一主题

perl程序求助 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-11-12 09:19 |只看该作者 |倒序浏览
RpsA
tagctacgttGTTAACCGTTGCGTGAAAACAGGatcgatctcgtgccg
RpsA
acaccgcaACCAAACTATCAAgtaacgttacagCATTCCGTAGgtaggttccattt
Rps3
cgggcgcgtcCGGATTGAGCTGTacgtgtaattgcTTTACGCCTTGCCACCCaaagggccatttcgcaGCGGTCCAGGCatcccgcctt
要求:1 把大写字母之间的小写字母(红色的)提出来,编号为I001,I002,I003。(大写字母之间的小写字母出现的个数不定)。
2 把开头、结尾的小写字母和大写字母连成一行,编号为S001,S002,S003。(它们的内容是一样)。并把相应的序列放到上面序列下面。
3 算出开头小写字母的长度、结尾小写字母的长度和总长度,存到文件1.txt里。
4 最后再把S001、S002、S003。。。后的小写字母变成大写字母。
结果为:
RpsA
I001
S001tagctacgttGTTAACCGTTGCGTGAAAACAGGatcgatctcgtgccg
RpsA
I001gtaacgttacag
S001acaccgcaACCAAACTATCAACATTCCGTAGgtaggttccattt
Rps3
I001acgtgtaattgc
S001cgggcgcgtcCGGATTGAGCTGTTTTACGCCTTGCCACCCGCGGTCCAGGCatcccgcctt
I002aaagggccatttcgca
S002cgggcgcgtcCGGATTGAGCTGTTTTACGCCTTGCCACCCGCGGTCCAGGCatcccgcctt

输出的文件1.txt
10  48  15
8    56  13
10  89  10

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
2 [报告]
发表于 2013-11-12 10:36 |只看该作者
楼主的给的例子好象跟你说的逻辑不是太一样. 建议楼主整理好了再发.

论坛徽章:
0
3 [报告]
发表于 2013-11-12 11:45 |只看该作者
RpsA
tagctacgttGTTAACCGTTGCGTGAAAACAGGatcgatctcgtgccg
RpsA
acaccgcaACCAAACTATCAAgtaacgttacagCATTCCGTAGgtaggttccattt
Rps3
cgggcgcgtcCGGATTGAGCTGTacgtgtaattgcTTTACGCCTTGCCACCCaaagggccatttcgcaGCGGTCCAGGCatcccgcctt
要求:1 把大写字母之间的小写字母(红色的)提出来,编号为I001,I002,I003。(大写字母之间的小写字母出现的个数不定)。
2 把开头、结尾的小写字母和大写字母连成一行,编号为S001,S002,S003。(它们的内容是一样)。并把相应的序列放到上面序列下面。
3 算出开头小写字母的长度、总长度和结尾小写字母的长度,存到文件1.txt里。
4 最后再把I001,I002,I003和S001,S002,S003后的小写字母变成大写字母。
结果为:
RpsA
I001
S001TAGCTACGTTGTTAACCGTTGCGTGAAAACAGGATCGATCTCGTGCCG
RpsA
I001GTAACGTTACAG
S001ACACCGCAACCAAACTATCAACATTCCGTAGGTAGGTTCCATTT
Rps3
I001ACGTGTAATTGC
S001CGGGCGCGTCCGGATTGAGCTGTTTTACGCCTTGCCACCCGCGGTCCAGGCATCCCGCCTT
I002AAAGGGCCATTTCGCA
S002CGGGCGCGTCCGGATTGAGCTGTTTTACGCCTTGCCACCCGCGGTCCAGGCATCCCGCCTT

输出的文件1.txt
10  48  15
8    56  13
10  89  10




回复 2# q1208c


   

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
4 [报告]
发表于 2013-11-12 13:22 |只看该作者
  1. #!/usr/bin/perl

  2. open ONE, '>', '1.txt';
  3. while (<DATA>) {
  4.     print;
  5.     my $atgc       = <DATA>;
  6.     my $length_all = length($atgc) - 1;
  7.     my ( $begin, $end ) = $atgc =~ /^([agtc]*).*?([atgc]*)$/;
  8.     my @I = $atgc =~ /(?:[ATGC])([atgc]+)(?:[ATGC])/g;
  9.     @I = '' unless @I;
  10.     $atgc =~ tr/atgc/ATGC/;
  11.     my $i = 1;

  12.     for (@I) {
  13.         tr/atgc/ATGC/;
  14.         printf "I%03i%s\n", $i, $_;
  15.         printf "S%03i%s", $i++, $atgc;
  16.     }
  17.     print ONE join "\t", length $begin, $length_all, length $end;
  18.     print ONE "\n";
  19. }

  20. __DATA__
  21. RpsA
  22. tagctacgttGTTAACCGTTGCGTGAAAACAGGatcgatctcgtgccg
  23. RpsA
  24. acaccgcaACCAAACTATCAAgtaacgttacagCATTCCGTAGgtaggttccattt
  25. Rps3
  26. cgggcgcgtcCGGATTGAGCTGTacgtgtaattgcTTTACGCCTTGCCACCCaaagggccatttcgcaGCGGTCCAGGCatcccgcctt
复制代码
回复 1# zhagnqiang829


   

论坛徽章:
0
5 [报告]
发表于 2013-11-12 17:11 |只看该作者
呵呵,完全正确。谢谢你的热心帮助。

回复 4# pitonas


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP