免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: bugouhen
打印 上一主题 下一主题

文本内容替换的脚本,帮看是否能够优化一下 [复制链接]

论坛徽章:
0
12 [报告]
发表于 2009-12-28 13:36 |只看该作者
大概200个目录,500个文件左右?
总共200*500=10w个文件,每个文件3w行?

论坛徽章:
0
11 [报告]
发表于 2009-12-28 13:30 |只看该作者
原帖由 莫良23 于 2009-12-28 13:04 发表
每次用sed来处理100个文件肯定比100次调用sed每次处理一个文件要快



您的意思是
先读取 新旧卡号变量
然后循环 sed 所有的文件

论坛徽章:
0
10 [报告]
发表于 2009-12-28 13:04 |只看该作者
每次用sed来处理100个文件肯定比100次调用sed每次处理一个文件要快

论坛徽章:
0
9 [报告]
发表于 2009-12-28 12:42 |只看该作者
用Hash做,原始值作为key,替换值作为value

论坛徽章:
0
8 [报告]
发表于 2009-12-28 12:26 |只看该作者
原帖由 nhw_cs 于 2009-12-28 11:49 发表



淡有时候也可以扯, 但不能胡扯. 愿闻其详: shell与sed区别到底是啥啊




恩  请23 帮忙解释一下。。
谢谢

我现在是找了个性能好点的机器跑 感觉快了点哈

论坛徽章:
0
7 [报告]
发表于 2009-12-28 12:17 |只看该作者
不知道这样会不会快点?还是会更慢
  1. DIR="xxxx"
  2. for i in `cat name.txt `
  3. do
  4.   cd $DIR/$i
  5.   for file in *.DAT
  6.   do
  7.     awk -F, -v OFS=, 'NR==FNR{split($0,m,".");a[m[1]]=m[2];delete m}NR>FNR{if ($6 in a) $6=a[$6];$1=$1;print}' $DIR/a.txt $file >$file.new
  8.     \mv -f $file.new $file
  9.   done
  10. done
复制代码

论坛徽章:
0
6 [报告]
发表于 2009-12-28 11:49 |只看该作者
原帖由 莫良23 于 2009-12-28 11:24 发表
把那个sed用shell来代替



淡有时候也可以扯, 但不能胡扯. 愿闻其详: shell与sed区别到底是啥啊

论坛徽章:
0
5 [报告]
发表于 2009-12-28 11:26 |只看该作者
原帖由 莫良23 于 2009-12-28 11:24 发表
把那个sed用shell来代替


把sed那句写成 sh
sh   sed.sh   ?


是这个意思吧 ??
这样会提升速度么 ??

xiexie

[ 本帖最后由 bugouhen 于 2009-12-28 12:27 编辑 ]

论坛徽章:
0
4 [报告]
发表于 2009-12-28 11:24 |只看该作者
把那个sed用shell来代替

论坛徽章:
0
3 [报告]
发表于 2009-12-28 11:19 |只看该作者
麻烦 请楼上的 多解释一下好么
谢谢
  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP