免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 6066 | 回复: 22
打印 上一主题 下一主题

求助perl脚本,取某一段 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-03-31 22:26 |只看该作者 |倒序浏览
>Canis
ATGAAGGCGGCGGATGAGCCTGCCTACCTGACAGTGGG                                               ENSG00000003756_RBM5_raw_NT  15 25

如上左边一个文件中有上述基因序列,如右边有一个要取的位置从15到25,有很多这样的文件需按右边的表格去将文件中序列取出,15 25前是文件名

论坛徽章:
6
丑牛
日期:2014-03-21 15:42:04子鼠
日期:2014-04-12 11:50:17处女座
日期:2014-09-01 09:25:1115-16赛季CBA联赛之吉林
日期:2015-12-22 14:01:5215-16赛季CBA联赛之广东
日期:2016-03-08 18:49:422016科比退役纪念章
日期:2016-07-06 12:19:55
2 [报告]
发表于 2014-03-31 23:11 |只看该作者
你的意思是不是文件名字为ENSG00000003756_RBM5_raw_NT有下面的内容,如果是的话,是只有两行吗,如果不是,多举几个例子咯?
>Canis
ATGAAGGCGGCGGATGAGCCTGCCTACCTGACAGTGGG    ENSG00000003756_RBM5_raw_NT  15 25


字段ENSG00000003756_RBM5_raw_NT  15 25是不是和ATGAAGGCGGCGGATGAGCCTGCCTACCTGACAGTGGG是在同一行的?
还是说ENSG00000003756_RBM5_raw_NT  15 25是在另外一个文件 ? 而且有很多类似这样的行 ?

论坛徽章:
7
戌狗
日期:2013-12-15 20:43:38技术图书徽章
日期:2014-03-05 01:33:12技术图书徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16赛季CBA联赛之青岛
日期:2016-03-17 20:36:13
3 [报告]
发表于 2014-03-31 23:59 |只看该作者
晕,题目我都看不懂。

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
4 [报告]
发表于 2014-04-01 07:52 |只看该作者
最近怎么这么多人搞 生物工程呢 ? 还都跟perl 干上了.


看了半天, 发现, 原来我的语文是体育老师教的, 我要回去重修了.

论坛徽章:
8
技术图书徽章
日期:2013-09-30 08:51:28技术图书徽章
日期:2013-12-11 09:26:39白羊座
日期:2013-12-27 15:27:13金牛座
日期:2014-01-06 09:13:05天蝎座
日期:2014-01-21 14:23:28酉鸡
日期:2014-05-09 16:51:12卯兔
日期:2014-08-11 16:49:1515-16赛季CBA联赛之八一
日期:2017-08-14 23:24:57
5 [报告]
发表于 2014-04-01 09:17 |只看该作者
本帖最后由 xiumu2280 于 2014-04-01 09:19 编辑
  1. my $sequence = substr ($seq,15,25-15)
复制代码
这个可以取序列,其他自己想把····

论坛徽章:
0
6 [报告]
发表于 2014-04-01 13:27 |只看该作者
回复 2# stanley_tam


   

论坛徽章:
0
7 [报告]
发表于 2014-04-01 13:31 |只看该作者
右图是许多文件的文件夹,左图是文件里的内容,左下图是一个txt文本,里面有要取的位置,文件中的四个物种都取相同的位置,求大神指点perl脚本回复 6# yang7473453


   

论坛徽章:
8
技术图书徽章
日期:2013-09-30 08:51:28技术图书徽章
日期:2013-12-11 09:26:39白羊座
日期:2013-12-27 15:27:13金牛座
日期:2014-01-06 09:13:05天蝎座
日期:2014-01-21 14:23:28酉鸡
日期:2014-05-09 16:51:12卯兔
日期:2014-08-11 16:49:1515-16赛季CBA联赛之八一
日期:2017-08-14 23:24:57
8 [报告]
发表于 2014-04-01 14:08 |只看该作者
@pitonas  你的取截图文字的程序呢

论坛徽章:
5
丑牛
日期:2014-01-21 08:26:26卯兔
日期:2014-03-11 06:37:43天秤座
日期:2014-03-25 08:52:52寅虎
日期:2014-04-19 11:39:48午马
日期:2014-08-06 03:56:58
9 [报告]
发表于 2014-04-01 15:07 |只看该作者
{:2_172:} install ImageMagick
  1. import -window root screenshot.jpg
复制代码
回复 8# xiumu2280


   

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
10 [报告]
发表于 2014-04-01 15:17 |只看该作者
回复 6# yang7473453
你的意思是:
  1. #!/usr/bin/perl -w

  2. my $txt = '24.txt';
  3. my ( $key, %seqId );
  4. open TXT, $txt or die $!;
  5. open OUT, '>', 'Sequence_extraction_part.fa' or die "don't worry";

  6. while (<TXT>) {
  7.     my ( $file, $s, $e) = ( split /\s+/, $_)[ 0, 1, 2 ];
  8.     my $l = $e - $s + 1;
  9.         my $chr = ( split /_/, $file)[1];
  10.     extract( $file, $chr, $s, $l, $_ );   

  11. }

  12. sub extract {
  13.     my ( $fin, $SequenceId, $start, $len, $m ) = @_;
  14. open( SCA, $fin ) or die $!;
  15. while (<SCA>) {
  16.     chomp;
  17.     /^>/ ? ( ($key) = /^>(\w+)/ ) : $seqId{$key} .= $_;
  18. }
  19. close SCA;
  20.     unless ( exists $seqId{$SequenceId} ) {
  21.         print "$SequenceId\t$start\t$start+$len\terro\n";
  22.         return;
  23.     }

  24.     my $Seq = substr $seqId{$SequenceId}, $start - 1, $len;  
  25.     my @OUT;
  26.     my $lenseq = length($Seq);
  27.     for ( my $j = 0 ; $j * 60 < $lenseq ; $j++ ) {
  28.         push @OUT, substr( $Seq, $j * 60, 60 ), "\n";
  29.     }
  30.     print OUT ">$m", @OUT;
  31. }

  32. close OUT;
复制代码
这样吗?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP