免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 5009 | 回复: 16
打印 上一主题 下一主题

[文本处理] awk老帖子,用上传文件测试,别自己写 [复制链接]

论坛徽章:
13
丑牛
日期:2013-08-16 15:08:22技术图书徽章
日期:2013-11-26 10:13:40双鱼座
日期:2013-11-08 15:03:26戌狗
日期:2013-11-08 13:52:30技术图书徽章
日期:2013-11-05 14:06:30戌狗
日期:2013-10-31 11:45:42CU十二周年纪念徽章
日期:2013-10-24 15:41:34天秤座
日期:2013-10-11 14:55:08子鼠
日期:2013-09-26 19:36:35水瓶座
日期:2013-09-26 17:44:56午马
日期:2013-08-26 10:24:23丑牛
日期:2013-08-19 14:43:22
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-12-13 15:52 |只看该作者 |倒序浏览
本帖最后由 代号:军刀 于 2013-12-16 11:27 编辑

http://bbs.chinaunix.net/thread-4112429-1-1.html
@yestreenstars
test.zip (1.5 KB, 下载次数: 4) 解压完有一个test.php文件
  1. [root@ dir]$ cat file
  2. <HOME_URL>                      主页    http://baidu.com
复制代码
执行
  1. awk 'NR==FNR{a[$1]=$3;next}{for(i in a)gsub(i,a[i])}{print > FILENAME}' file test.php
复制代码
发现test.php成了这样,内容断了

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2013-12-13 15:56 |只看该作者
对不起,我害了你,以后一定慎用print > FILENAME~
直接修改文件的操作都应该事先备份,这一点你应该清楚吧?

论坛徽章:
13
丑牛
日期:2013-08-16 15:08:22技术图书徽章
日期:2013-11-26 10:13:40双鱼座
日期:2013-11-08 15:03:26戌狗
日期:2013-11-08 13:52:30技术图书徽章
日期:2013-11-05 14:06:30戌狗
日期:2013-10-31 11:45:42CU十二周年纪念徽章
日期:2013-10-24 15:41:34天秤座
日期:2013-10-11 14:55:08子鼠
日期:2013-09-26 19:36:35水瓶座
日期:2013-09-26 17:44:56午马
日期:2013-08-26 10:24:23丑牛
日期:2013-08-19 14:43:22
3 [报告]
发表于 2013-12-13 16:03 |只看该作者
回复 2# yestreenstars


    我肯定先备份了,后来还原了用成原先写的sed,现在有空就来研究这个问题

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
4 [报告]
发表于 2013-12-13 16:09 |只看该作者
回复 3# 代号:军刀

Would you like to use Perl that combine the sed, awk, c, ...

$ echo abcd > FILE

$ cat FILE
abcd

$ perl -i -lape 's/b/B/g' FILE

$ cat FILE
aBcd

   

论坛徽章:
13
丑牛
日期:2013-08-16 15:08:22技术图书徽章
日期:2013-11-26 10:13:40双鱼座
日期:2013-11-08 15:03:26戌狗
日期:2013-11-08 13:52:30技术图书徽章
日期:2013-11-05 14:06:30戌狗
日期:2013-10-31 11:45:42CU十二周年纪念徽章
日期:2013-10-24 15:41:34天秤座
日期:2013-10-11 14:55:08子鼠
日期:2013-09-26 19:36:35水瓶座
日期:2013-09-26 17:44:56午马
日期:2013-08-26 10:24:23丑牛
日期:2013-08-19 14:43:22
5 [报告]
发表于 2013-12-13 16:12 |只看该作者
回复 4# jason680


    你可以看下我之前的帖子,不是一句话就能讲清楚的
   http://bbs.chinaunix.net/thread-4112429-1-1.html

论坛徽章:
13
丑牛
日期:2013-08-16 15:08:22技术图书徽章
日期:2013-11-26 10:13:40双鱼座
日期:2013-11-08 15:03:26戌狗
日期:2013-11-08 13:52:30技术图书徽章
日期:2013-11-05 14:06:30戌狗
日期:2013-10-31 11:45:42CU十二周年纪念徽章
日期:2013-10-24 15:41:34天秤座
日期:2013-10-11 14:55:08子鼠
日期:2013-09-26 19:36:35水瓶座
日期:2013-09-26 17:44:56午马
日期:2013-08-26 10:24:23丑牛
日期:2013-08-19 14:43:22
6 [报告]
发表于 2013-12-13 16:16 |只看该作者
回复 2# yestreenstars


    而现在我用sed又遇到了&这个符号,然后昨天你用awk来解决这个问题,我又掀起了老帖子,真是一波未平一波又起,太有意思了:wink:

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
7 [报告]
发表于 2013-12-13 16:27 |只看该作者
回复 5# 代号:军刀

Would you like this

$ grep . config [ab].txt
config:<SERVERID> 1
config:<SERVER_NAME> aaaaa
a.txt:1
a.txt:2
a.txt:3
a.txt:SERVERID=<SERVERID>
a.txt:4
b.txt:5555
b.txt:<SERVERID>
b.txt:<SERVER_NAME> fdsaf

$ perl -i -lape 'BEGIN{for(`cat config`){if(m/(<[^>]+>)\s+(.+)/){$h{$1}=$2}}}{s/(<[^>]+>)/$h{$1}/g}' [ab].txt

$ grep . config [ab].txt
config:<SERVERID> 1
config:<SERVER_NAME> aaaaa
a.txt:1
a.txt:2
a.txt:3
a.txt:SERVERID=1
a.txt:4
b.txt:5555
b.txt:1
b.txt:aaaaa fdsaf

   

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
8 [报告]
发表于 2013-12-13 16:31 |只看该作者
回复 6# 代号:军刀


    you can use Perl without & issue

论坛徽章:
3
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:51:162015年亚洲杯之阿曼
日期:2015-04-07 20:00:59
9 [报告]
发表于 2013-12-13 17:13 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
60
20周年集字徽章-20	
日期:2020-10-28 14:04:3015-16赛季CBA联赛之北京
日期:2016-07-06 15:42:0715-16赛季CBA联赛之同曦
日期:2016-06-12 10:38:0915-16赛季CBA联赛之佛山
日期:2016-05-27 11:54:56黄金圣斗士
日期:2015-12-02 11:44:35白银圣斗士
日期:2015-11-25 14:32:43白银圣斗士
日期:2015-11-23 12:53:352015亚冠之布里斯班狮吼
日期:2015-10-21 16:55:482015亚冠之首尔
日期:2015-09-01 16:46:052015亚冠之德黑兰石油
日期:2015-08-31 11:39:192015亚冠之萨济拖拉机
日期:2015-08-28 21:06:5315-16赛季CBA联赛之广东
日期:2016-07-12 14:58:53
10 [报告]
发表于 2013-12-13 17:46 |只看该作者
我一致也没搞清楚这个东西。。试试下面的这个,然后再思考这个问题,到底是为什么:
  1. awk 'NR==FNR{a[$1]=$3;next}{for(i in a)gsub(i,a[i])}{print | "cat >" FILENAME}' file test.php
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP