免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12
最近访问板块 发新帖
楼主: littleboys
打印 上一主题 下一主题

[文本处理] awk 文件处理 [复制链接]

论坛徽章:
0
11 [报告]
发表于 2014-03-18 13:36 |只看该作者
回复 8# q1208c

这是一个实际项目里面的小需求


   

论坛徽章:
33
荣誉会员
日期:2011-11-23 16:44:17天秤座
日期:2014-08-26 16:18:20天秤座
日期:2014-08-29 10:12:18丑牛
日期:2014-08-29 16:06:45丑牛
日期:2014-09-03 10:28:58射手座
日期:2014-09-03 16:01:17寅虎
日期:2014-09-11 14:24:21天蝎座
日期:2014-09-17 08:33:55IT运维版块每日发帖之星
日期:2016-04-17 06:23:27操作系统版块每日发帖之星
日期:2016-04-18 06:20:00IT运维版块每日发帖之星
日期:2016-04-24 06:20:0015-16赛季CBA联赛之天津
日期:2016-05-06 12:46:59
12 [报告]
发表于 2014-03-18 13:43 |只看该作者
回复 11# littleboys

如果你说是为了练习使用 awk, 那我觉得没啥问题. 更复杂的组合也是正常的.

如果是实际项目, 那更奇怪了. 怎么会select出数据来, 还需要二次处理, 而这些都可以直接在数据库里完成的. 如果项目做成后面还要跟一个 awk脚本, 这样的项目, 对于后期维护来说, 就是个坑, 谁来维护, 谁就在坑边, 说不定哪时就掉下去了.

祝楼主好运 !!

论坛徽章:
0
13 [报告]
发表于 2014-03-18 14:06 |只看该作者
不是一个单一的项目,有几个关联的项目,数据是别的项目通过MQ 发过来的,而下游对这些数据进行二次处理。

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
14 [报告]
发表于 2014-03-18 14:40 |只看该作者
回复 4# littleboys

would you like this by function s

# awk 'function s(n, x){x=substr($0,a[n],b[n]);gsub("^ +| +$","",x);return x}/^---/{for(c=1;c<=NF;c++){n=length($c);a[c]=a[c-1]+b[c-1]+1;b[c]=n}}{if((s(6)=="EOSE-GEN"&&s(7)~/^[US]/)||(s(6)=="ORD-SHIP"&&s(7)=="S"))next;print $0}' FILE
TX_ID       EOSE_NUM   SEN      ARRIVAL_TS                     TX_TYPE  TX_SUBTYPE STATUS SUCCESS_TYPE
----------- ---------- -------- ------------------------------ -------- ---------- ------ ------------------------------
   10234962 Q89212              2011-12-09-12.02.07.520000     EOSE     ORD-SHIP   U      2011-12-09-12.02.07.520000
   10234964 Q89212              2011-12-09-12.02.07.520000     EOSE     EOSE-GEN   D      2011-12-09-12.02.07.520000
   10234965 Q89212              2011-12-09-12.02.07.520000     EOSE     EOSE-GEN   F      2011-12-09-12.02.07.520000

  8 record(s) selected.

   

论坛徽章:
6
处女座
日期:2014-04-02 16:07:17酉鸡
日期:2014-04-14 10:09:22子鼠
日期:2014-04-17 11:57:30辰龙
日期:2014-09-01 17:14:08戌狗
日期:2014-10-28 12:25:54未羊
日期:2014-11-14 11:31:58
15 [报告]
发表于 2014-03-19 10:30 |只看该作者
  1. awk '$6=="EOSE-GEN"&&$7~/U|S/{next}$6=="ORD-SHIP"&&$7=="S"{next}1' o
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP