免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
1234下一页
最近访问板块 发新帖
查看: 7201 | 回复: 30
打印 上一主题 下一主题

文本内容替换的脚本,帮看是否能够优化一下 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-12-28 10:48 |只看该作者 |正序浏览
大家好
现手头有一批要替换的文本文件,写了个脚本请大家帮忙看一下是否能够再优化一下。这个循环太多了 速度实在是太慢

如下
a.txt
前后是新旧两组号码,要把指定文本的包含的旧号码,换成后面对应的新号码,大概300数据
140200003700.140200042852
142600009182.142600069906
142300003784.142300033332
142600009618.142600084180
142600038153.142600066756
142600002050.142600066015
142300003729.142300033319
142600014686.142600072919


tail 14_10002_2009348_VIP.DAT   这些DAT文件即为要替换的文本,每个DAT文件平均大概3w行数据左右
14,10002,2009348     ,14030065    ,100037,2009-12-21 19:59:37,2.00         ,140300020299,
14,10002,2009348     ,14270093    ,100247,2009-12-21 19:59:37,2.00         ,142700107999,
14,10002,2009348     ,14010023    ,100290,2009-12-21 19:59:37,2.00         ,140100141364
把后面的卡号 用a.txt中的对应内容替换

脚本:
for i in `cat name.txt `
do
cd DIR/$i
for a in `cat DIR/a.txt`
do
old=`echo $a |awk -F . {'print $1'}`
new=`echo $a |awk -F . {'print $2'}`
sed -i  s/"${old}"/"${new}"/g  DIR/$i/*.DAT
done
done

其中name.txt是一个 目录的列表 ,每个列表下有多个 DAT文件。大概200个目录,500个文件左右。

大家看一下我这个循环是否还能在优化一下  ,我测试了一下 跑起来实在是太慢了 全跑一次 大概要 一整天。。
或者能提供一个能提高一下速度的思路  

谢谢

[ 本帖最后由 bugouhen 于 2009-12-28 11:39 编辑 ]

论坛徽章:
0
31 [报告]
发表于 2009-12-30 15:36 |只看该作者
并行跑吧,这些数据没有关连的

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
30 [报告]
发表于 2009-12-30 13:25 |只看该作者

回复 #21 ly5066113 的帖子

好的,明白了。

论坛徽章:
0
29 [报告]
发表于 2009-12-30 12:05 |只看该作者

回复 #28 kilior 的帖子

你确定楼主的xxxx文件里是一行一个的?楼主可没说

论坛徽章:
0
28 [报告]
发表于 2009-12-30 11:47 |只看该作者
for i in `cat xxxxx`
效率之低,浪费多少内才能,知道吗?
全给我改成:

  1. while read i ;do
  2. echo $i
  3. done << xxxxx
复制代码

论坛徽章:
0
27 [报告]
发表于 2009-12-30 10:18 |只看该作者
用C吧

论坛徽章:
0
26 [报告]
发表于 2009-12-28 23:08 |只看该作者
写程序会比SHELL更快么?

论坛徽章:
0
25 [报告]
发表于 2009-12-28 16:54 |只看该作者

回复 #24 ly5066113 的帖子

我错了。有时候脑袋一根筋,都没去想原来数据是怎样的

论坛徽章:
23
15-16赛季CBA联赛之吉林
日期:2017-12-21 16:39:27白羊座
日期:2014-10-27 11:14:37申猴
日期:2014-10-23 08:36:23金牛座
日期:2014-09-30 08:26:49午马
日期:2014-09-29 09:40:16射手座
日期:2014-11-25 08:56:112015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:49:0315-16赛季CBA联赛之山东
日期:2017-12-21 16:39:1915-16赛季CBA联赛之广东
日期:2016-01-19 13:33:372015亚冠之山东鲁能
日期:2015-10-13 09:39:062015亚冠之西悉尼流浪者
日期:2015-09-21 08:27:57
24 [报告]
发表于 2009-12-28 16:51 |只看该作者

回复 #23 ywlscpl 的帖子

$0没变化,就原样输出啊,FS本就是 ,   为什么一定要 OFS 生效呢?

论坛徽章:
0
23 [报告]
发表于 2009-12-28 16:49 |只看该作者
原帖由 ly5066113 于 2009-12-28 15:44 发表
不需要啊,$6=a[$6] 就可以了


!($6 in a)的就不执行这句 $6=a[$6] 了
  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP