免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1426 | 回复: 2
打印 上一主题 下一主题

[文本处理] 如何分割提取 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-01-26 12:39 |只看该作者 |倒序浏览
本帖最后由 怿_mao44 于 2013-01-26 12:40 编辑

输入文件:
  1. AC        MI000123
  2. ID        abc-123
  3. MI        MI0016766        aa-123
  4. MI        MI0020948        bb-123
  5. //
  6. AC        MI000321
  7. ID        aa-321
  8. MI        MI0018151        bb-321
  9. MI        MI0019851        dd-321
  10. //
复制代码
规则:
1.输入文件以“AC”进行分割
(且以“//”结尾,不过这部分暂不用考虑,这里只考虑以“AC”开头即可)
2.每个单位中希望提取“ID”后第二列记录
3.以及对应每个单位中“MI”后第三列记录

期望输出文件:
  1. ##ID        MI
  2. abc-123        aa-123
  3. abc-123        bb-123
  4. aa-321        bb-321
  5. aa-321        dd-321
复制代码
又要麻烦各位的了。。

论坛徽章:
5
2015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:50:282015年亚洲杯之朝鲜
日期:2015-03-13 22:47:33IT运维版块每日发帖之星
日期:2016-01-09 06:20:00IT运维版块每周发帖之星
日期:2016-03-07 16:27:44
2 [报告]
发表于 2013-01-26 12:43 |只看该作者
回复 1# 怿_mao44


    比较粗糙的方法
  1. awk '/ID/{id=$2;next}$1 ~ /MI/{print id,$3}' urfile
复制代码

论坛徽章:
0
3 [报告]
发表于 2013-01-26 14:04 |只看该作者
回复 2# blackold


    原来这样可以的呀。。
谢谢的了,其实这样就挺简单明了的

都怪自己把问题想麻烦的了,自己琢磨着要先分割单位,再提取,再合并。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP