免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1638 | 回复: 4
打印 上一主题 下一主题

[文本处理] 求教一个文本处理问题,大神有木有 [已解决,感谢关阴月飞] [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-02-22 18:25 |只看该作者 |倒序浏览
本帖最后由 diwcrystal 于 2013-02-22 19:56 编辑

请教个问题,有类似如下的一段代码,每段的的两个index值相同,需要将每段atom_type内的名称后添加这段的index编号,比如index 1那么VAL_MIN就转换为VAL_MIN 1,每段的atome_type条数不定,段落总数不下于2000。同时要求仅转换index开始的atom_type值,段落中其他的atom_type不受影响,如下方所示的SUB_MIN和SUB_MAX。

  1.       article_type "INFO"
  2.          index  1
  3.       article_type "VAL"
  4.          index  1
  5.          atom_type "VAL_MIN" value "0"
  6.          atom_type "VAL_MAX" value "100"
  7.       article_type "INFO   "
  8.          index  2
  9.       article_type "VAL"
  10.          index  2
  11.          atom_type "VAL_MIN" value "0"
  12.          atom_type "VAL_MAX" value "50"
  13.       article_type "INFO   "
  14.          index  3
  15.       article_type "VAL"
  16.          index  3
  17.          atom_type "VAL_MIN" value "0"
  18.          atom_type "VAL_MAX" value "20"
  19.       article_type "SUBS"
  20.          atom_type "SUB_MIN" value "0"
  21.          atom_type "SUB_MAX" value "0"
复制代码
转换后的效果如下,
  1.       article_type "INFO"
  2.          index  1
  3.       article_type "VAL"
  4.          index  1
  5.          atom_type "VAL_MIN 1" value "0"
  6.          atom_type "VAL_MAX 1" value "100"
  7.       article_type "INFO   "
  8.          index  2
  9.       article_type "VAL"
  10.          index  2
  11.          atom_type "VAL_MIN 2" value "0"
  12.          atom_type "VAL_MAX 2" value "50"
  13.       article_type "INFO   "
  14.          index  3
  15.       article_type "VAL"
  16.          index  3
  17.          atom_type "VAL_MIN 3" value "0"
  18.          atom_type "VAL_MAX 3" value "20"
  19.       article_type "SUBS"
  20.          atom_type "SUB_MIN" value "0"
  21.          atom_type "SUB_MAX" value "0"
复制代码
高手帮忙出出主意,谢谢了

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
2 [报告]
发表于 2013-02-22 19:20 |只看该作者
本帖最后由 关阴月飞 于 2013-02-22 23:29 编辑

回复 1# diwcrystal

  1. awk '/index/{a=1;n=$NF}/article_type/{a=0}a&&/atom_type/{sub(/"$/," "n"\"",$2);print "\t"$0;next}1' urfile
复制代码

论坛徽章:
0
3 [报告]
发表于 2013-02-22 19:29 |只看该作者
本帖最后由 diwcrystal 于 2013-02-22 19:30 编辑

回复 2# 关阴月飞

谢谢,不过这个还有点问题,它会把article_type下没index引导的atom_type也添加编号,譬如最末几行变成了:
  1.       article_type "SUBS"
  2.          atom_type "SUB_MIN 3" value "0"
  3.          atom_type "SUB_MAX 3" value "0"
复制代码
最末的要求不变(段内没有index)

论坛徽章:
39
辰龙
日期:2013-08-21 15:45:192015亚冠之广州富力
日期:2015-05-12 16:34:52亥猪
日期:2015-03-03 17:22:00申猴
日期:2015-03-03 17:21:37未羊
日期:2014-10-10 13:45:41戌狗
日期:2014-06-17 09:53:29巨蟹座
日期:2014-06-12 23:17:17双鱼座
日期:2014-06-10 12:42:44寅虎
日期:2014-06-09 12:52:172015亚冠之卡尔希纳萨夫
日期:2015-05-24 15:24:35黄金圣斗士
日期:2015-12-02 17:25:0815-16赛季CBA联赛之吉林
日期:2017-06-24 16:43:52
4 [报告]
发表于 2013-02-22 19:47 |只看该作者
回复 3# diwcrystal

刚刚没仔细看要求, 改了一下.


   

论坛徽章:
0
5 [报告]
发表于 2013-02-22 19:51 |只看该作者
回复 4# 关阴月飞


Perfect!
实在太感谢了,我再好好研究下


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP