忘记密码   免费注册 查看新帖 | 论坛精华区

ChinaUnix.net

  平台 论坛 博客 认证专区 大话IT HPC论坛 徽章 文库 沙龙 自测 下载 频道自动化运维 虚拟化 储存备份 C/C++ PHP MySQL 嵌入式 Linux系统
123
最近访问板块 发新帖
楼主: rougayo

【生物信息】一个perl脚本的求助 [复制链接]

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2017-03-03 13:12 |显示全部楼层
perl abc.pl
-----------------------------
ENSMEUP00000000639      gnl|UMD3.1|GK000015.2   65.97   144     10      1       1       105     48997711        48998142        3.00E-51        184
ENSMEUP00000000639      gnl|UMD3.1|GK000015.2   65.97   144     10      1       1       105     48997711        48998142        3.00E-51        184
ENSMEUP00000000639      gnl|UMD3.1|GK000015.2   65.97   144     10      1       1       105     48997711        48998142        3.00E-51        184

论坛徽章:
0
发表于 2017-03-03 18:13 |显示全部楼层
回复 20# sunzhiguolu

你好!刚验证了一下,成功的运行了脚本且达到了所要的目的,对此真的非常的感谢你!对于脚本,自己在理解的过程中还是存在一些问题的:
1.为什么split改为默认后与用“,”分割会导致结果数据的不同?
2.push (@{$hData{$id}}, [$val, $_]);
这个语句中,@{$hData{$id}} 指的是什么呀?%hData 中存的键是ID,值是val么?,这个我有点不太明白,也不太懂,push“[$val, $_]”数组的末端是为啥....
3. my @aT = sort {$b->[0] <=> $a->[0]} @{$hData{$_}}
排序的时候,我【0】指的不是ID么,排序不是按照分值(val)的大小来排么?

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2017-03-03 18:53 |显示全部楼层
回复 22# rougayo
2. 标量 $id 是 ID,
@{$hData{$id}} 对键值为 $id 的哈希变量 %hData 进行解引用操作
push (@{$hData{$id}}, [$val, $_]) 将标量 $val, $_ 作为匿名数组 [$val, $_] 添加到被解引用后的哈希变量中

3. 根据指定的键值 ($id) 对哈希变量 %hData 进行解引用操作,且对解引用后的匿名数组进行降序排序,
排序依据为匿名数组中的索引值为 0 的元素 (即:根据 $val 的值)


论坛徽章:
7
巳蛇
日期:2013-11-28 09:22:59天秤座
日期:2014-10-25 15:40:452015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:53:172015亚冠之德黑兰石油
日期:2015-07-15 08:46:452015亚冠之平阳省
日期:2015-11-08 16:27:53白银圣斗士
日期:2015-11-14 09:58:12
发表于 2017-05-24 09:13 |显示全部楼层
回复 1# rougayo

如果是本地BLAST,可以直接在命令行里限制每次比对输出的匹配序列数目;
一方面,可以提高检索速度,另一方面,也方便你查看结果。

比如BLAST+中的blastn参数如下(具体每个参数代表意义,可以用 blastn -help 来获取):
  1. liu@Liu-P50:~$ blastn -h
  2. USAGE
  3.   blastn [-h] [-help] [-import_search_strategy filename]
  4.     [-export_search_strategy filename] [-task task_name] [-db database_name]
  5.     [-dbsize num_letters] [-gilist filename] [-seqidlist filename]
  6.     [-negative_gilist filename] [-entrez_query entrez_query]
  7.     [-db_soft_mask filtering_algorithm] [-db_hard_mask filtering_algorithm]
  8.     [-subject subject_input_file] [-subject_loc range] [-query input_file]
  9.     [-out output_file] [-evalue evalue] [-word_size int_value]
  10.     [-gapopen open_penalty] [-gapextend extend_penalty]
  11.     [-perc_identity float_value] [-qcov_hsp_perc float_value]
  12.     [-max_hsps int_value] [-xdrop_ungap float_value] [-xdrop_gap float_value]
  13.     [-xdrop_gap_final float_value] [-searchsp int_value]
  14.     [-sum_stats bool_value] [-penalty penalty] [-reward reward] [-no_greedy]
  15.     [-min_raw_gapped_score int_value] [-template_type type]
  16.     [-template_length int_value] [-dust DUST_options]
  17.     [-filtering_db filtering_database]
  18.     [-window_masker_taxid window_masker_taxid]
  19.     [-window_masker_db window_masker_db] [-soft_masking soft_masking]
  20.     [-ungapped] [-culling_limit int_value] [-best_hit_overhang float_value]
  21.     [-best_hit_score_edge float_value] [-window_size int_value]
  22.     [-off_diagonal_range int_value] [-use_index boolean] [-index_name string]
  23.     [-lcase_masking] [-query_loc range] [-strand strand] [-parse_deflines]
  24.     [-outfmt format] [-show_gis] [-num_descriptions int_value]
  25.     [-num_alignments int_value] [-line_length line_length] [-html]
  26.     [-max_target_seqs num_sequences] [-num_threads int_value] [-remote]
  27.     [-version]

  28. DESCRIPTION
  29.    Nucleotide-Nucleotide BLAST 2.2.31+

  30. Use '-help' to print detailed descriptions of command line arguments
复制代码



论坛徽章:
7
巳蛇
日期:2013-11-28 09:22:59天秤座
日期:2014-10-25 15:40:452015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:53:172015亚冠之德黑兰石油
日期:2015-07-15 08:46:452015亚冠之平阳省
日期:2015-11-08 16:27:53白银圣斗士
日期:2015-11-14 09:58:12
发表于 2017-05-24 09:13 |显示全部楼层
回复 1# rougayo

如果是本地BLAST,可以直接在命令行里限制每次比对输出的匹配序列数目;
一方面,可以提高检索速度,另一方面,也方便你查看结果。

比如BLAST+中的blastn参数如下(具体代表意义,可以用 blastn -help 来获取):
  1. liu@Liu-P50:~$ blastn -h
  2. USAGE
  3.   blastn [-h] [-help] [-import_search_strategy filename]
  4.     [-export_search_strategy filename] [-task task_name] [-db database_name]
  5.     [-dbsize num_letters] [-gilist filename] [-seqidlist filename]
  6.     [-negative_gilist filename] [-entrez_query entrez_query]
  7.     [-db_soft_mask filtering_algorithm] [-db_hard_mask filtering_algorithm]
  8.     [-subject subject_input_file] [-subject_loc range] [-query input_file]
  9.     [-out output_file] [-evalue evalue] [-word_size int_value]
  10.     [-gapopen open_penalty] [-gapextend extend_penalty]
  11.     [-perc_identity float_value] [-qcov_hsp_perc float_value]
  12.     [-max_hsps int_value] [-xdrop_ungap float_value] [-xdrop_gap float_value]
  13.     [-xdrop_gap_final float_value] [-searchsp int_value]
  14.     [-sum_stats bool_value] [-penalty penalty] [-reward reward] [-no_greedy]
  15.     [-min_raw_gapped_score int_value] [-template_type type]
  16.     [-template_length int_value] [-dust DUST_options]
  17.     [-filtering_db filtering_database]
  18.     [-window_masker_taxid window_masker_taxid]
  19.     [-window_masker_db window_masker_db] [-soft_masking soft_masking]
  20.     [-ungapped] [-culling_limit int_value] [-best_hit_overhang float_value]
  21.     [-best_hit_score_edge float_value] [-window_size int_value]
  22.     [-off_diagonal_range int_value] [-use_index boolean] [-index_name string]
  23.     [-lcase_masking] [-query_loc range] [-strand strand] [-parse_deflines]
  24.     [-outfmt format] [-show_gis] [-num_descriptions int_value]
  25.     [-num_alignments int_value] [-line_length line_length] [-html]
  26.     [-max_target_seqs num_sequences] [-num_threads int_value] [-remote]
  27.     [-version]

  28. DESCRIPTION
  29.    Nucleotide-Nucleotide BLAST 2.2.31+

  30. Use '-help' to print detailed descriptions of command line arguments
复制代码



您需要登录后才可以回帖 登录 | 注册

本版积分规则

10张SACC2017门票等你来拿~

在数字化转型时代,云已成为万物智能的数字化大脑。而随着大数据应用、人工智能、移动互联网等技术的飞速发展,“智慧 +” 的概念正在深入到各行各业,提升企业效率,释放商业潜能,创造全新机遇。作为国内顶级技术盛会之一,2017 中国系统架构师大会(SACC2017)将于 10 月 19-21 日在北京新云南皇冠假日酒店震撼来袭。今年,大会以 “云智未来” 为主题,云集国内外顶级专家,围绕云计算、人工智能、大数据、移动互联网、产业应用等热点领域展开技术探讨与交流。本届大会共设置 2 大主会场,18 个技术专场;邀请来自互联网、金融、制造业、电商等多个领域,100 余位技术专家及行业领袖来分享他们的经验;并将吸引 4000 + 人次的系统运维、架构师及 IT 决策人士参会,为他们提供最具价值的交流平台。
----------------------------------------
优惠时间:2017年10月19日前

活动链接>>
  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号 北京市公安局海淀分局网监中心备案编号:11010802020122
广播电视节目制作经营许可证(京) 字第1234号 中国互联网协会会员  联系我们:
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP