免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: huang6894
打印 上一主题 下一主题

[文本处理] awk对于两文本数据比较的优化问题? [复制链接]

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-10-02 06:20:00IT运维版块每月发帖之星
日期:2015-09-11 19:30:52IT运维版块每周发帖之星
日期:2015-09-11 19:20:31IT运维版块每日发帖之星
日期:2015-08-26 06:20:00每日论坛发贴之星
日期:2015-08-20 06:20:00IT运维版块每日发帖之星
日期:2015-08-20 06:20:002015年辞旧岁徽章
日期:2015-03-03 16:54:15金牛座
日期:2014-05-04 16:58:09双子座
日期:2013-12-17 16:44:37辰龙
日期:2013-11-22 15:20:59狮子座
日期:2013-11-18 22:55:08射手座
日期:2013-11-12 10:54:26
11 [报告]
发表于 2013-08-05 17:05 |只看该作者
用perl吧或者python专治你这种问题。shell有点偏。

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
12 [报告]
发表于 2013-08-05 17:10 |只看该作者
本帖最后由 huang6894 于 2013-08-05 17:12 编辑

回复 10# zxd_echo


    没用过脚本形式的,和awk -F'\t' 'NR==FNR{a[FNR]=$1;b[FNR]=$2;c[FNR]=$3;num=FNR}NR>FNR{for(i=1;i<=num;i++){if
(($1==a)&&($2<=c)&&($2>=b)){print $0}}}' filter_allgene.txt ./ref/file_* >>result_0805.txt
的区别可以说说吗?

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
13 [报告]
发表于 2013-08-05 17:10 |只看该作者
回复 11# wenhq


    就是不会呀{:3_194:}

论坛徽章:
0
14 [报告]
发表于 2013-08-05 17:22 |只看该作者
回复 12# huang6894


    区别就是把一堆命令放到文件里,通过文件调用的方式执行awk命令, awk -f xxx.awk argv[1] argv[2]

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
15 [报告]
发表于 2013-08-05 17:34 |只看该作者
回复 14# zxd_echo


    可是还是很耗内存不是咩?{:3_194:} 谢谢大大~大大辛苦啦

论坛徽章:
0
16 [报告]
发表于 2013-08-05 17:43 |只看该作者
回复 15# huang6894


    这样很耗cpu,没有把数据存为数组。

论坛徽章:
8
技术图书徽章
日期:2013-08-22 11:21:28未羊
日期:2015-01-19 22:22:25巳蛇
日期:2014-08-11 16:53:08子鼠
日期:2014-05-29 09:04:44摩羯座
日期:2014-04-11 14:15:07丑牛
日期:2014-01-24 12:41:28金牛座
日期:2013-11-21 17:38:28射手座
日期:2015-01-21 08:50:32
17 [报告]
发表于 2013-08-05 17:44 |只看该作者
回复 16# zxd_echo


    那有没有比较好的改进方法呢?

论坛徽章:
0
18 [报告]
发表于 2013-08-06 17:45 |只看该作者
要看两个文件有多大?
可以按 染色体编号 拆成小文件来处理。


您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP