免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1842 | 回复: 7

[文本处理] 求个awk ,判断,重复处理的方法 [复制链接]

论坛徽章:
0
发表于 2018-03-29 13:56 |显示全部楼层
求教:
文本ip.txt
eth2:30.30.30.2:30.30.30.1
eth1:20.20.20.2:20.20.20.1
eth0:10.10.10.2:10.10.10.1
eth0:172.18.1.2:172.18.1.1
eth0:172.16.1.2:172.16.1.1
eth0:192.168.1.2:192.168.1.1
eth3:1.1.1.2:1.1.1.1
eth0:2.2.2.2:2.2.2.1
eth4:40.40.40.2:40.40.40.1
eth4:4.4.4.4:4.4.4.4
eth5:50.50.50.2:50.50.50.1
tun0:60.60.60.2:60.60.60.1
eth0 默认输出2;eth1:默认输出3;eth2:默认输出4,eth4:默认输出5;其他:默认输出6;出现第2次eth0:输出7,第3次eth0:输出8;如文本中出现:一直输出到11;eth4第二次:输出12,一直下去累积下去。用awk 怎么写

论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
发表于 2018-03-29 15:34 |显示全部楼层
本帖最后由 wh7211 于 2018-03-29 20:25 编辑

回复 1# lmtwl


如文本中出现:一直输出到11;eth4第二次:输出12,一直下去累积下去。用awk 怎么写

从源文本看,eth0应该一直输出到10,eth4第二次输出11。

  1. awk -F":" '{a[NR]=$0}END{for(i in a){if(a[i]~"eth0"){c=b++?b+5:2;a[i]=a[i]" -> "c}else if(a[i]~"eth1"){a[i]=a[i]" -> 3"}else if(a[i]~"eth2"){a[i]=a[i]" -> 4"}else{a[i]=a[i]" -> 6"}};for(i in a){if(a[i]~"eth4"){e=d++?d+c-1:5;gsub("-> 6","-> "e"",a[i])};print a[i]}}' ip.txt
复制代码

输出:
eth2:30.30.30.2:30.30.30.1 -> 4
eth1:20.20.20.2:20.20.20.1 -> 3
eth0:10.10.10.2:10.10.10.1 -> 2
eth0:172.18.1.2:172.18.1.1 -> 7
eth0:172.16.1.2:172.16.1.1 -> 8
eth0:192.168.1.2:192.168.1.1 -> 9
eth3:1.1.1.2:1.1.1.1 -> 6
eth0:2.2.2.2:2.2.2.1 -> 10
eth4:40.40.40.2:40.40.40.1 -> 5
eth4:4.4.4.4:4.4.4.4 -> 11
eth5:50.50.50.2:50.50.50.1 -> 6
tun0:60.60.60.2:60.60.60.1 -> 6

论坛徽章:
0
发表于 2018-03-29 16:51 |显示全部楼层
回复 2# wh7211
谢谢回复,感谢感谢
还有问题
我想输出的结果是:
eth2:30.30.30.2:30.30.30.1 -> 4
eth1:20.20.20.2:20.20.20.1 -> 3
eth0:10.10.10.2:10.10.10.1 -> 2
eth0:172.18.1.2:172.18.1.1 -> 7
eth0:172.16.1.2:172.16.1.1 -> 8
eth0:192.168.1.2:192.168.1.1 -> 9
eth3:1.1.1.2:1.1.1.1 -> 5
eth0:2.2.2.2:2.2.2.1 -> 10
eth4:40.40.40.2:40.40.40.1 -> 6
eth4:4.4.4.4:4.4.4.4 -> 11
eth5:50.50.50.2:50.50.50.1 -> 12
tun0:60.60.60.2:60.60.60.1 -> 13

eth0 定义2;eth1定义3 ;eth2定义4;eth3定义5;其他口子默认先定义个6 ;再以次增加1。
文本中eth0 第一次出现定义2,第2次的时候定义到8去,以此类加。
后面的值不能重复。

我shell 来实现了,awk 始终弄不出来。
再shell中我很笨的实现了这个:先定义了个只有一个元素7开始的数组。通过行读取,通过awk 对每行,eth进行初始的定义2、3、4、5后,在数组中查询这个值是否存在数组中。如果不存在,最追加到数组,如果存在,获取数组中最大的值,然后把这个值+1


论坛徽章:
0
发表于 2018-03-29 17:54 |显示全部楼层
没看懂楼主到底要干嘛。
大致写了个linux下的powershell代码:
  1. $hash = @{
  2. eth0 = 2
  3. eth1 = 3
  4. eth2 = 4
  5. eth3 = 5
  6. ethx = 6
  7. }

  8. $基数 = 6
  9. $hash.eth0 = $hash.eth0 + $基数

  10. $要找的内容 = 'eth0'
  11. if ($行.contains($要找的内容))
  12. {
  13.         $行 = $行 + '->' + $hash[$要找的内容]
  14. }
复制代码

论坛徽章:
0
发表于 2018-03-29 18:02 |显示全部楼层
回复 4# 本友会机友会摄友会

我需要的结果是 eth2:30.30.30.2:30.30.30.1  4
eth1:20.20.20.2:20.20.20.1  3
eth0:10.10.10.2:10.10.10.1  2
eth0:172.18.1.2:172.18.1.1  8
eth0:172.16.1.2:172.16.1.1  9
eth0:192.168.1.2:192.168.1.1  10
eth3:1.1.1.2:1.1.1.1  5
eth0:2.2.2.2:2.2.2.1  11
eth4:40.40.40.2:40.40.40.1  6
eth4:4.4.4.4:4.4.4.4  12
eth5:50.50.50.2:50.50.50.1  13
tun0:60.60.60.2:60.60.60.1  14
tun1:70.70.70.2:70.70.70.1  15


上面这个是我用shell 跑出来的。在想怎么用awk 实现这样的结果

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2018-03-29 18:38 |显示全部楼层
$ awk -F: 'BEGIN{t=6;n=7}func p(k,v){if(k<=3){d=v?n++:k+2}else{if(t){d=t;t=0}else d=n++}print $0" -> "d}match($1,"eth([0-9]+)",m){k=m[1];p(k,a[k]++);next}{p(9,n)}' ip.txt
eth2:30.30.30.2:30.30.30.1 -> 4
eth1:20.20.20.2:20.20.20.1 -> 3
eth0:10.10.10.2:10.10.10.1 -> 2
eth0:172.18.1.2:172.18.1.1 -> 7
eth0:172.16.1.2:172.16.1.1 -> 8
eth0:192.168.1.2:192.168.1.1 -> 9
eth3:1.1.1.2:1.1.1.1 -> 5
eth0:2.2.2.2:2.2.2.1 -> 10
eth4:40.40.40.2:40.40.40.1 -> 6
eth4:4.4.4.4:4.4.4.4 -> 11
eth5:50.50.50.2:50.50.50.1 -> 12
tun0:60.60.60.2:60.60.60.1 -> 13

论坛徽章:
0
发表于 2018-03-29 19:41 |显示全部楼层
回复 6# jason680

感谢,感谢,再次感谢,就是这个效果

论坛徽章:
25
程序设计版块每日发帖之星
日期:2016-05-03 06:20:0015-16赛季CBA联赛之八一
日期:2018-07-05 10:34:09黑曼巴
日期:2018-07-06 15:19:5015-16赛季CBA联赛之佛山
日期:2018-08-03 13:19:3315-16赛季CBA联赛之山西
日期:2018-08-07 19:46:2315-16赛季CBA联赛之广夏
日期:2018-08-08 19:31:5015-16赛季CBA联赛之青岛
日期:2018-11-26 15:21:5015-16赛季CBA联赛之上海
日期:2018-12-11 09:45:3219周年集字徽章-年
日期:2020-04-18 23:54:5215-16赛季CBA联赛之深圳
日期:2020-04-19 21:40:19黑曼巴
日期:2022-04-03 17:55:1315-16赛季CBA联赛之八一
日期:2018-07-03 16:56:46
发表于 2018-03-29 20:24 |显示全部楼层
本帖最后由 wh7211 于 2018-03-29 20:25 编辑

回复 3# lmtwl


  1. awk -F":" '{a[NR]=$0}END{for(i in a){if(a[i]~"eth0"){c=b++?b+5:2;a[i]=a[i]" -> "c;d[i]++}else if(a[i]~"eth1"){a[i]=a[i]" -> 3";d[i]++}else if(a[i]~"eth2"){a[i]=a[i]" -> 4";d[i]++}else if(a[i]~"eth3"){a[i]=a[i]" -> 5";d[i]++}else{a[i]=a[i]" -> 6"}};for(i in a){if(!d[i]){if(a[i]~"eth4"){f=e++?++c:6}else{f=++c};gsub("-> 6","-> "f"",a[i])};print a[i]}}' ip.txt
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP