免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: mouseyuan
打印 上一主题 下一主题

搜索字符生成新文件问题 [复制链接]

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
11 [报告]
发表于 2009-01-06 09:04 |只看该作者
awk '{for(i=1;i<=NF;i++)if($i+0>100 && $i+0<999)printf $i" ";printf "\n"}'
如何呢?

论坛徽章:
0
12 [报告]
发表于 2009-01-06 09:04 |只看该作者

回复 #7 haimming 的帖子

再测了一次时间
[test@erpdataserver ~]$ time awk '{for (i=1;i<=NF;i++) if (length($i)==3 && $i+0==$i) printf $i" ";printf "\n"}'  urfile >newfile.txt

real    1m21.266s
user    1m20.735s
sys     0m0.533s
[test@erpdataserver ~]$ time awk '{for(i=1;i<=NF;i++)if($i~/\<[0-9][0-9][0-9]\>/)printf $i" ";printf "\n"}'  urfile >newfile.txt

real    2m0.598s
user    2m0.154s
sys     0m0.439s

仅供参考。。

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
13 [报告]
发表于 2009-01-06 09:07 |只看该作者

回复 #9 我是DBA 的帖子

grep 会有什么问题?

你这个也可以的呀:
grep -Eo  '\<[0-9]{3}\>' ufile | sort -n

论坛徽章:
0
14 [报告]
发表于 2009-01-06 09:09 |只看该作者

回复 #11 beginner-bj 的帖子

[test@erpdataserver ~]$ time awk '{for(i=1;i<=NF;i++)if($i+0>100 && $i+0<999)printf $i" ";printf "\n"}' urfile >newfile.txt

real    1m37.910s
user    1m37.528s
sys     0m0.420s

论坛徽章:
0
15 [报告]
发表于 2009-01-06 09:11 |只看该作者

回复 #13 ly5066113 的帖子

他不是一行文件,是很多行,应该要处理成一行一行的
grep 出来就只成一列了。。。

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
16 [报告]
发表于 2009-01-06 09:14 |只看该作者

回复 #15 我是DBA 的帖子

估计楼主没说清楚,如果他要对所以提取出来的数字排序,肯定要一列的。

论坛徽章:
0
17 [报告]
发表于 2009-01-06 09:18 |只看该作者

回复 #14 我是DBA 的帖子

谢谢!看来都比我估计得要快

论坛徽章:
0
18 [报告]
发表于 2009-01-06 09:25 |只看该作者

回复 #16 ly5066113 的帖子

是啊,我们都是来猜的,哈

论坛徽章:
0
19 [报告]
发表于 2009-01-06 09:26 |只看该作者

回复 #17 haimming 的帖子

我的测试文件只是200多M跟11G还是有很大差别的。

论坛徽章:
0
20 [报告]
发表于 2009-01-06 09:36 |只看该作者
awk果然强大
awk内置函数效率还是比较高的

[ 本帖最后由 ywlscpl 于 2009-1-6 09:39 编辑 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP