免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 25982 | 回复: 8
打印 上一主题 下一主题

如何用cat合并大批量文件 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2009-08-06 09:09 |只看该作者 |倒序浏览
我有一个大批量的文件存放到 text/ 目录下,里面的文件命名是这样的:

text_20090102.0800
text_20090102.0805
text_20090102.0810
text_20090102.0815
text_20090102.0820
text_20090102.0825
text_20090102.0830
... ...

文件名是“text_日期.时间”,这是每5分钟产生的文件。
我现在想把这些小文件合并成一个大的文件,但是我遇到个问题。
我知道 cat 可以把多个文件合并到一个文件中,但是需要把所有的文件名都写上,这是个很麻烦的事情。
我想问一下,在linux的shell中,如何利用 cat 把一个文件夹中的所有像这样的文件都合并成一个大文件?
谢谢!

论坛徽章:
0
2 [报告]
发表于 2009-08-06 09:10 |只看该作者
cat text_2009* >newfile

论坛徽章:
0
3 [报告]
发表于 2009-08-06 09:15 |只看该作者
那我在合并的时候,能判断下其中的文件名吗?就是说,如果有的文件是这样的:text_20090102.6578,这个显然是错误的,因为时间是没有65:78的,请问这个我需要怎么判断?
还有,后边的时间必须是4位,这个是不是可以使用模式识别来判断? 像 /text_20090102\.[0-2][0-9][0-5][0-9]/ 这样来写?

论坛徽章:
0
4 [报告]
发表于 2009-08-06 09:19 |只看该作者

回复 #3 yiyeguhong 的帖子

用shell通配符
cat text_2009*.[0-2][0-9][0-5][0-9] >newfile

要精确的判断日期、时间的合法性话借助grep awk sed等工具吧

论坛徽章:
0
5 [报告]
发表于 2009-08-06 09:23 |只看该作者
我原先只使用grep、awk、sed来处理文件内的内容的,从没用来处理过文件名的判断,难道也可以进行文件名的判断?
呵呵,学习了~~
非常感谢 ywlscpl  !

论坛徽章:
0
6 [报告]
发表于 2009-08-06 09:33 |只看该作者

回复 #5 yiyeguhong 的帖子

可以这样的
ls text_* | grep(awk、sed) ....|xargs cat  >newfile

论坛徽章:
0
7 [报告]
发表于 2009-08-06 09:37 |只看该作者
哦,谢谢,我没想到用管道。非常感谢。

论坛徽章:
0
8 [报告]
发表于 2009-08-06 09:37 |只看该作者

回复 #1 yiyeguhong 的帖子

find .  -name  text_20090102\.[0-2][0-9][0-5][0-9]  -exec  cat  > newfile

论坛徽章:
0
9 [报告]
发表于 2009-08-06 09:45 |只看该作者
for file in text_*
do
     echo "File name is: $file " >>yourFile; #打印文件名字
     cat $file >> yourFile;    #输出文件内容
done

这样可以吗
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP