免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: kakaliu
打印 上一主题 下一主题

[文本处理] find内容 并建立对应的目录 [复制链接]

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
11 [报告]
发表于 2014-12-03 17:45 |只看该作者
回复 9# kakaliu

$ find /backup | grep -E '(htm|g)$'
/backup/gold/guandian/2010-12/2113423.htm
/backup/gold/guandian/2010-12/2110274.htm
/backup/html/2014/c203_0217/W020140217370194853792.png
/backup/html/2014/c203_0323/W020140323327068017183.jpg

$ find /var/www/html/ | grep -E '(htm|g)$'

$ cat html.log
httpx://www.xxx.com.cn/gold/guandian/2010-12/2110274.htm
httpx://www.xxx.com.cn/gold/guandian/2010-12/2113423.htm
httpx://www.xxx.com.cn/html/2014/c203_0217/W020140217370194853792.png
httpx://www.xxx.com.cn/html/2014/c203_0323/W020140323327068017183.jpg

Note: the "httpx" is "http" in file

$ awk -vsrc="/backup" -vdes="/var/www/html" -F"/" '{p="";for(n=4;n<NF;n++){p=p$n"/"};cmd="mkdir -p "des"/"p";\n cp " src"/"p $NF" "des"/"p; print(cmd)}' html.log
mkdir -p /var/www/html/gold/guandian/2010-12/;
cp /backup/gold/guandian/2010-12/2110274.htm /var/www/html/gold/guandian/2010-12/
mkdir -p /var/www/html/gold/guandian/2010-12/;
cp /backup/gold/guandian/2010-12/2113423.htm /var/www/html/gold/guandian/2010-12/
mkdir -p /var/www/html/html/2014/c203_0217/;
cp /backup/html/2014/c203_0217/W020140217370194853792.png /var/www/html/html/2014/c203_0217/
mkdir -p /var/www/html/html/2014/c203_0323/;
cp /backup/html/2014/c203_0323/W020140323327068017183.jpg /var/www/html/html/2014/c203_0323/

# Note: check output information(shell command) without issue and change the "print" to "system" to run the command

$ awk -vsrc="/backup" -vdes="/var/www/html" -F"/" '{p="";for(n=4;n<NF;n++){p=p$n"/"};cmd="mkdir -p "des"/"p";\n cp " src"/"p $NF" "des"/"p; system(cmd)}' html.log

$ find /var/www/html/ | grep -E '(htm|g)$'
/var/www/html/gold/guandian/2010-12/2113423.htm
/var/www/html/gold/guandian/2010-12/2110274.htm
/var/www/html/html/2014/c203_0217/W020140217370194853792.png
/var/www/html/html/2014/c203_0323/W020140323327068017183.jpg

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP