免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 10226 | 回复: 25
打印 上一主题 下一主题

[文本处理] shell 脚本求助 ,循环处理大量文件 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2014-03-21 12:29 |只看该作者 |倒序浏览
大家好,现在想用脚本处理test 目录下大量(10000多)文件,对每个文件的处理是相同的,先是删除前九行,然后对每个文件的第二列进行赋值,接着提取文件前四列,不知道这个循环怎么写。急需处理大量数据,求助

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
2 [报告]
发表于 2014-03-21 13:11 |只看该作者
我不是太明白这个问题的难度在哪里?
是不会取目录(test)下的文件呢?
还是不会写删除前9行?

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
3 [报告]
发表于 2014-03-21 13:13 |只看该作者
猜的:
  1. awk 'NR>9{$2="xxoo";NF=4;print}' test/*
复制代码

论坛徽章:
0
4 [报告]
发表于 2014-03-21 15:04 |只看该作者
回复 3# yestreenstars
  赋值!

   

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
5 [报告]
发表于 2014-03-21 15:06 |只看该作者
貌似没啥难度!目测论坛里的大神,很少对没有数据的帖子感兴趣

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
6 [报告]
发表于 2014-03-21 15:39 |只看该作者
回复 4# love_shift

没搞懂他的赋值是啥意思,所以随便乱写了~
   

论坛徽章:
0
7 [报告]
发表于 2014-03-22 11:25 |只看该作者
回复 2# q1208c
对大神们来说肯定是不难的啥,我是shell脚本小白,现在在啃这一部分知识,有点慢。我知道用find找到目录下的文件然后用sed删除了1-9行,接着用awk给每个文件第二列符合条件的数值赋值(改成其他的值),但是不知道用循环(for或是其他的)怎么写,因为要把每次处理的文件输出来,接下还有其他的用处。所以在帖子上请教了,呵呵呵,还望多指教,是急着用这些数据,不过以后还是要把 linux shell好好学学。


   

论坛徽章:
0
8 [报告]
发表于 2014-03-22 11:38 |只看该作者
回复 3# yestreenstars
你好,首先先谢谢你啦。我的问题可能写的不太清楚。就是在test目录下有很多文件(数目不清楚),想先find这些文件(后缀都相同,.lammpstrj),然后删除每个文件前九行,接着对每个文件第二列符合条件的数值进行赋值(换成其他的数,比如第二列为1,则换成1.27,否则换成1.6)。每个文件都是这样的处理。想用循环做,因为接下来我还有其他的处理。不知道这个循环语句怎么写。对单个文件的操作我知道怎么弄,但是怎么循环,读取这些文件,再一个个处理后输出与原文件相同前缀的文件(比如原文件是0001.lammmpstrj,处理后输出成0001.txt文件)。在linux shell上还在学习。谢大神赐教。


   

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
9 [报告]
发表于 2014-03-22 13:56 |只看该作者
回复 7# hanhuanhuan
  1. function process ()
  2. {
  3.     echo "##$1##"
  4. }
  5. for my_file in `find $1 -type f`
  6. do
  7.      process $my_file
  8. done
复制代码
你这手也太新了.

论坛徽章:
0
10 [报告]
发表于 2014-03-22 22:50 |只看该作者
回复 9# q1208c




恩恩,还请多指教。先谢谢啦。帮我看看下面这个脚本,就测试了4个文件,老长时间都不出来结果,不知道什么原因。
#!/bin/bash
for i in ` find file -type f -name "*.lammpstrj" `
do
a=`sed -i '1,9d' $i`
cat $a | while read line
  do
 echo $line | awk '{if ($2=="1" print $1 ,$3 ,$4 ,$5 ,$6="1.27" ; else print $1 ,$3 ,$4 ,$5 ,$6="158"}'
  done
done
   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP