免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1758 | 回复: 5
打印 上一主题 下一主题

[文本处理] 求文本处理优化思路 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-03-19 18:28 |只看该作者 |倒序浏览
本帖最后由 ljwd1000 于 2013-03-19 18:32 编辑

需求:需要将文本指定段落的匹配行做相应的替换,请大家帮忙优化一下代码及处理的思路,谢谢了

原文本
  1. [root@ tmp]# cat 1
  2.                         4 => array(
  3.                                 'table_name_inc' => "m_",
  4.                                 'mysql_host' => "10.190.141.141:8004",
  5.                                 'mysql_name' => "ytser",
  6.                                 'mysql_pass' => "yOck_123ok",
  7.                                 'mysql_db' => "game2_3",
  8.                                 'java_ip'=>'10.190.242.137:9007',
  9.                                 'java_ip2'=>'10.190.242.137:8001',
  10.                         ),
  11.                         5 => array(
  12.                                 'table_name_inc' => "m_",
  13.                                 'mysql_host' => "10.190.141.141:8004",
  14.                                 'mysql_name' => "ytser",
  15.                                 'mysql_pass' => "yOck_123ok",
  16.                                 'mysql_db' => "game2_5",
  17.                                 'java_ip'=>'10.190.242.86:9007',
  18.                                 'java_ip2'=>'10.190.242.86:8001',
  19.                         ),
  20.                         6 => array(
  21.                                 'table_name_inc' => "m_",
  22.                                 'mysql_host' => "10.190.141.141:8004",
  23.                                 'mysql_name' => "ytser",
  24.                                 'mysql_pass' => "yOck_123ok",
  25.                                 'mysql_db' => "game2_5",
  26.                                 'java_ip'=>'10.190.242.86:9007',
  27.                                 'java_ip2'=>'10.190.242.86:8001',
  28.                         ),
  29.           ),
复制代码
我自己写的awk代码:
  1. [root@ tmp]# cat x.awk

  2. /5 =>/{print;
  3. while(getline k){
  4.     if(k~/mysql_host/){
  5.         print gensub(/([^"]*")([^"]*)(.*)/,"\\18.8.8.8\\3","g",k)
  6.         }
  7.     else{
  8.         if(k~/mysql_name/){
  9.             print gensub(/([^"]*")([^"]*)(.*)/,"\\1test\\3","g",k)
  10.             next;
  11.         }
  12.         else{
  13.             print k
  14.         }
  15.     }
  16. }
  17. }1
复制代码
结果:
  1. [root@ tmp]# awk -f x.awk 1
  2.                         4 => array(
  3.                                 'table_name_inc' => "m_",
  4.                                 'mysql_host' => "10.190.141.141:8004",
  5.                                 'mysql_name' => "ytser",
  6.                                 'mysql_pass' => "yOck_123ok",
  7.                                 'mysql_db' => "game2_3",
  8.                                 'java_ip'=>'10.190.242.137:9007',
  9.                                 'java_ip2'=>'10.190.242.137:8001',
  10.                         ),
  11.                         5 => array(
  12.                                 'table_name_inc' => "m_",
  13.                                 'mysql_host' => "8.8.8.8",
  14.                                 'mysql_name' => "test",
  15.                                 'mysql_pass' => "yOck_123ok",
  16.                                 'mysql_db' => "game2_5",
  17.                                 'java_ip'=>'10.190.242.86:9007',
  18.                                 'java_ip2'=>'10.190.242.86:8001',
  19.                         ),
  20.                         6 => array(
  21.                                 'table_name_inc' => "m_",
  22.                                 'mysql_host' => "10.190.141.141:8004",
  23.                                 'mysql_name' => "ytser",
  24.                                 'mysql_pass' => "yOck_123ok",
  25.                                 'mysql_db' => "game2_5",
  26.                                 'java_ip'=>'10.190.242.86:9007',
  27.                                 'java_ip2'=>'10.190.242.86:8001',
  28.                         ),
  29.           ),
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2013-03-19 19:52 |只看该作者
看看这个如何?
  1. awk '/5 => array\(/{k=1}/),/{k=0}k{if(/mysql_host/)sub($NF,"\"8.8.8.8\",");if(/mysql_name/)sub($NF,"\"test\",")}1'
复制代码

论坛徽章:
6
摩羯座
日期:2013-08-24 10:43:10狮子座
日期:2013-08-25 10:27:06天秤座
日期:2013-09-11 20:28:44午马
日期:2014-09-28 16:06:0015-16赛季CBA联赛之八一
日期:2016-12-19 13:55:0515-16赛季CBA联赛之天津
日期:2016-12-20 14:01:23
3 [报告]
发表于 2013-03-19 20:10 |只看该作者
@yestreenstars
学习

awk对指定段落的匹配行做相应的替换
思路:
匹配段开头,做个标记,直到匹配到段结束,取消标记。
判断在标记存在的时候,将匹配到的行做替换。

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
4 [报告]
发表于 2013-03-20 08:55 |只看该作者
  1. awk 'BEGIN{RS=ORS="array";FS=OFS="\n"}{if(NR==3)sub(/10.190.141.141:8004/,"8.8.8.8")sub(/ytser/,"test");print $0}'
复制代码

论坛徽章:
0
5 [报告]
发表于 2013-03-20 09:43 |只看该作者
回复 2# yestreenstars


    多谢,学习了

论坛徽章:
0
6 [报告]
发表于 2013-03-20 09:45 |只看该作者
回复 4# dn833


    多谢,学习了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP