免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Shell › perl

1 234 / 4 页下一页

最近访问板块

发新帖

楼主: super_two

上一主题

下一主题

[文本处理] perl [复制链接]

论坛徽章:: 95

程序设计版块每日发帖之星
日期:2015-09-05 06:20:00

程序设计版块每日发帖之星
日期:2015-09-17 06:20:00

程序设计版块每日发帖之星
日期:2015-09-18 06:20:00

2015亚冠之阿尔艾因
日期:2015-09-18 10:35:08

月度论坛发贴之星
日期:2015-09-30 22:25:00

2015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39

程序设计版块每日发帖之星
日期:2015-10-05 06:20:00

每日论坛发贴之星
日期:2015-10-05 06:20:00

2015年亚冠纪念徽章
日期:2015-10-06 10:06:48

2015亚冠之塔什干棉农
日期:2015-10-19 19:43:35

程序设计版块每日发帖之星
日期:2015-10-21 06:20:00

每日论坛发贴之星
日期:2015-09-14 06:20:00

21楼 [报告]

发表于 2015-08-08 21:19 |只看该作者

回复 20# 聆雨淋夜

对于我不熟悉的语言来说, 我就没有发现可读性好的.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 7

巳蛇
日期:2013-11-28 09:22:59

天秤座
日期:2014-10-25 15:40:45

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015年迎新春徽章
日期:2015-03-04 09:53:17

2015亚冠之德黑兰石油
日期:2015-07-15 08:46:45

2015亚冠之平阳省
日期:2015-11-08 16:27:53

白银圣斗士
日期:2015-11-14 09:58:12

22楼 [报告]

发表于 2015-08-12 08:43 |只看该作者

本帖最后由 b114213903 于 2015-08-12 08:45 编辑

回复 3# MMMIX

#!/usr/bin/perl
use strict;
use Bio::SeqIO;
my $fasta=shift @ARGV;
(my $Out=$fasta)=~s/(\.[^\.]+$)/_out$1/;
my $IN=Bio::SeqIO->new(-file=>"$fasta",-format=>'fasta');
my $Lenths={};
my $Seqs={};
while(my $seq=$IN->next_seq){
my $id=$seq->id;
my $length=$seq->length;
(my $new_id=$id)=~s/^([^\.]+)\..+$/$1/;
if($Lenths->{$new_id}){
if($Lenths->{$new_id}<$length){
$Lenths->{$new_id}=$length;
$Seqs->{$new_id}=$seq;
}
}else{
$Lenths->{$new_id}=$length;
$Seqs->{$new_id}=$seq;
}
}
$IN->close();
my $OUT=Bio::SeqIO->new(-file=>">$Out",-format=>'fasta');
foreach my $id(sort keys %{$Seqs}){
print "$id\n";
$OUT->write_seq($Seqs->{$id});
}
$OUT->close();

复制代码

>qwer.1
AFRTYUIFGHJKLVBNM
>qwer.2
BVXNVFGSFYEBCSHB
>qwer.3
HDFKSHFGSERYFIEURHFSUFDSHVBSJEUABFUHABFCAHFBC
>rtyuip00.1
AFHBVSFHUACFKUSHDBAKFHAKUFHSADKFUA
>hhjkl.1
JDNVKHFBAKHFAKFAFJNSADFJAS
>hhjk.2
HFSDHNFKANFAKFIJI
>hhjk.3
JNFAJNFALSDFLMAD
>hhjk.4
KJGSEGJOAKFFDSMFAPOKEF

复制代码

>hhjk.4
KJGSEGJOAKFFDSMFAPOKEF
>hhjkl.1
JDNVKHFBAKHFAKFAFJNSADFJAS
>qwer.3
HDFKSHFGSERYFIEURHFSUFDSHVBSJEUABFUHABFCAHFBC
>rtyuip00.1
AFHBVSFHUACFKUSHDBAKFHAKUFHSADKFUA

复制代码

另外，FASTA格式的文档，有规定格式：一、ID行：“>”（大于号）开头，后面根ID名称及各种注释信息，不可换行。二、数据行：单纯的核酸或氨基酸序列，可以单行也可多行。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 7

巳蛇
日期:2013-11-28 09:22:59

天秤座
日期:2014-10-25 15:40:45

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015年迎新春徽章
日期:2015-03-04 09:53:17

2015亚冠之德黑兰石油
日期:2015-07-15 08:46:45

2015亚冠之平阳省
日期:2015-11-08 16:27:53

白银圣斗士
日期:2015-11-14 09:58:12

23楼 [报告]

发表于 2015-08-12 08:47 |只看该作者

回复 8# super_two

试试我用Bio::SeqIO模块的脚本！

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

24楼 [报告]

发表于 2015-08-12 18:10 |只看该作者

本帖最后由 super_two 于 2015-08-12 18:29 编辑

复制代码

回复 23# b114213903

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 7

巳蛇
日期:2013-11-28 09:22:59

天秤座
日期:2014-10-25 15:40:45

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015年迎新春徽章
日期:2015-03-04 09:53:17

2015亚冠之德黑兰石油
日期:2015-07-15 08:46:45

2015亚冠之平阳省
日期:2015-11-08 16:27:53

白银圣斗士
日期:2015-11-14 09:58:12

25楼 [报告]

发表于 2015-08-12 19:55 |只看该作者

回复 24# super_two

我的结果里面都有啊

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 95

程序设计版块每日发帖之星
日期:2015-09-05 06:20:00

程序设计版块每日发帖之星
日期:2015-09-17 06:20:00

程序设计版块每日发帖之星
日期:2015-09-18 06:20:00

2015亚冠之阿尔艾因
日期:2015-09-18 10:35:08

月度论坛发贴之星
日期:2015-09-30 22:25:00

2015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39

程序设计版块每日发帖之星
日期:2015-10-05 06:20:00

每日论坛发贴之星
日期:2015-10-05 06:20:00

2015年亚冠纪念徽章
日期:2015-10-06 10:06:48

2015亚冠之塔什干棉农
日期:2015-10-19 19:43:35

程序设计版块每日发帖之星
日期:2015-10-21 06:20:00

每日论坛发贴之星
日期:2015-09-14 06:20:00

26楼 [报告]

发表于 2015-08-12 20:01 |只看该作者

回复 24# super_two

你是修改过人家的脚本吧?

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

27楼 [报告]

发表于 2015-08-13 11:27 |只看该作者

hhjk
hhjkl
qwer
rtyuip00
昨天我的编辑器保存出错，我完全复制粘贴上去的结果

复制代码

回复 26# MMMIX

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 95

程序设计版块每日发帖之星
日期:2015-09-05 06:20:00

程序设计版块每日发帖之星
日期:2015-09-17 06:20:00

程序设计版块每日发帖之星
日期:2015-09-18 06:20:00

2015亚冠之阿尔艾因
日期:2015-09-18 10:35:08

月度论坛发贴之星
日期:2015-09-30 22:25:00

2015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39

程序设计版块每日发帖之星
日期:2015-10-05 06:20:00

每日论坛发贴之星
日期:2015-10-05 06:20:00

2015年亚冠纪念徽章
日期:2015-10-06 10:06:48

2015亚冠之塔什干棉农
日期:2015-10-19 19:43:35

程序设计版块每日发帖之星
日期:2015-10-21 06:20:00

每日论坛发贴之星
日期:2015-09-14 06:20:00

28楼 [报告]

发表于 2015-08-13 11:35 |只看该作者

回复 27# super_two

你读懂那个脚本了么? 懂了的话就不会有疑问了.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 7

巳蛇
日期:2013-11-28 09:22:59

天秤座
日期:2014-10-25 15:40:45

2015年辞旧岁徽章
日期:2015-03-03 16:54:15

2015年迎新春徽章
日期:2015-03-04 09:53:17

2015亚冠之德黑兰石油
日期:2015-07-15 08:46:45

2015亚冠之平阳省
日期:2015-11-08 16:27:53

白银圣斗士
日期:2015-11-14 09:58:12

29楼 [报告]

发表于 2015-08-13 12:55 |只看该作者

回复 26# MMMIX

应该是有修改过，因为我用来保存数据的哈希引用中，都是由新ID指向的原始读入的序列，不可能会造成数据差异。

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 95

程序设计版块每日发帖之星
日期:2015-09-05 06:20:00

程序设计版块每日发帖之星
日期:2015-09-17 06:20:00

程序设计版块每日发帖之星
日期:2015-09-18 06:20:00

2015亚冠之阿尔艾因
日期:2015-09-18 10:35:08

月度论坛发贴之星
日期:2015-09-30 22:25:00

2015亚冠之阿尔沙巴布
日期:2015-10-03 08:57:39

程序设计版块每日发帖之星
日期:2015-10-05 06:20:00

每日论坛发贴之星
日期:2015-10-05 06:20:00

2015年亚冠纪念徽章
日期:2015-10-06 10:06:48

2015亚冠之塔什干棉农
日期:2015-10-19 19:43:35

程序设计版块每日发帖之星
日期:2015-10-21 06:20:00

每日论坛发贴之星
日期:2015-09-14 06:20:00

30楼 [报告]

发表于 2015-08-13 13:48 |只看该作者

回复 29# b114213903

我觉得他是光看了脚本的输出, 但并没有检查脚本写入的文件.

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

1 234 / 4 页下一页

发新帖

Chinaunix › 论坛 › 程序设计 › Shell › perl

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP