免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1506 | 回复: 2
打印 上一主题 下一主题

[文本处理] 求教个问题,文本按序补全 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-03-11 22:28 |只看该作者 |倒序浏览
本帖最后由 diwcrystal 于 2013-03-11 22:54 编辑

求教一个问题,关于文本按序补全的。
有一个文本有很多段落组成,每个段落以object开始,段落里有以atom_type开始的许多属性段,但是每个段落里头atom_type属性段不一致,譬如有些有ABC,有些有ABD,有些BCD,有什么好的办法将每个段落补全,按照文本总的属性段以及各段落中的先后顺序,先后顺序不会冲突,假如共有属性ABCDEF,那么段落一中加补DEF项,段落二中加补CEF项,哪个位子缺就重新添加到哪个位置,新增项value为"",谢谢。
  1. object
  2.    create "VAF    "
  3.       type "PER       "
  4.       subtype "OKE        "
  5.       article_type "ROOT_A"
  6.          atom_type "A" value "AAA"
  7.          atom_type "B" value "BBB"
  8.          atom_type "D" value ""
  9.       article_type "ROOT_B"
  10.          atom_type "AA" value "AAA"
  11.          atom_type "BA" value "BBB"
  12.          atom_type "CA" value "CC"
  13. object
  14.    create "VAFD    "
  15.       type "PER       "
  16.       subtype "OKE        "
  17.       article_type "ROOT_A"
  18.          atom_type "A" value "AAA"
  19.          atom_type "D" value ""
  20. object
  21.    create "VAFC    "
  22.       type "PER       "
  23.       subtype "OKE        "
  24.       article_type "ROOT_A"
  25.          atom_type "B" value "BBB"
  26.          atom_type "D" value ""
复制代码
补全后
  1. object
  2.    create "VAF    "
  3.       type "PER       "
  4.       subtype "OKE        "
  5.       article_type "ROOT_A"
  6.          atom_type "A" value "AAA"
  7.          atom_type "B" value "BBB"
  8.          atom_type "D" value ""
  9.       article_type "ROOT_B"
  10.          atom_type "AA" value "AAA"
  11.          atom_type "BA" value "BBB"
  12.          atom_type "CA" value "CC"
  13. object
  14.    create "VAFD    "
  15.       type "PER       "
  16.       subtype "OKE        "
  17.       article_type "ROOT_A"
  18.          atom_type "A" value "AAA"
  19.          atom_type "B" value ""
  20.          atom_type "D" value ""
  21.       article_type "ROOT_B"
  22.          atom_type "AA" value ""
  23.          atom_type "BA" value ""
  24.          atom_type "CA" value ""
  25. object
  26.    create "VAFC    "
  27.       type "PER       "
  28.       subtype "OKE        "
  29.       article_type "ROOT_A"
  30.          atom_type "A" value ""
  31.          atom_type "B" value "BBB"
  32.          atom_type "D" value ""
  33.       article_type "ROOT_B"
  34.          atom_type "AA" value ""
  35.          atom_type "BA" value ""
  36.          atom_type "CA" value ""
复制代码

论坛徽章:
32
处女座
日期:2013-11-20 23:41:20双子座
日期:2014-06-11 17:20:43戌狗
日期:2014-06-16 11:05:00处女座
日期:2014-07-22 17:30:47狮子座
日期:2014-07-28 15:38:17金牛座
日期:2014-08-05 16:34:01亥猪
日期:2014-08-18 13:34:25白羊座
日期:2014-09-02 15:03:55金牛座
日期:2014-11-10 10:23:58处女座
日期:2014-12-02 09:17:52程序设计版块每日发帖之星
日期:2015-06-16 22:20:002015亚冠之塔什干火车头
日期:2015-06-20 23:28:22
2 [报告]
发表于 2013-03-11 22:45 |只看该作者
能否给个处理前和处理后的文本来对比一下?

论坛徽章:
0
3 [报告]
发表于 2013-03-11 22:55 |只看该作者
已经修改了下
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP