免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
12下一页
最近访问板块 发新帖
查看: 44823 | 回复: 11

[文本处理] IP段排序问题 [复制链接]

论坛徽章:
0
发表于 2016-08-13 08:11 |显示全部楼层
请教各位大侠

我有一个文件,内容如下
1.1.1.1,4.4.4.4/8,2.2.2.2,5.5.5.5/16,3.3.3.3,6.6.6.6/32
想通过正则,将其处理成两个并排序输出:
1.1.1.1,2.2.2.2,3.3.3.3
4.4.4.4/8,5.5.5.5/16,6.6.6.6/32

论坛徽章:
0
发表于 2016-08-13 09:21 |显示全部楼层
xargs -n2 filename

论坛徽章:
28
15-16赛季CBA联赛之八一
日期:2016-02-22 19:10:4215-16赛季CBA联赛之深圳
日期:2016-12-01 10:34:0415-16赛季CBA联赛之新疆
日期:2016-12-07 10:24:2915-16赛季CBA联赛之同曦
日期:2016-12-15 12:06:43CU十四周年纪念徽章
日期:2016-12-18 13:03:4415-16赛季CBA联赛之吉林
日期:2017-01-03 15:52:2515-16赛季CBA联赛之辽宁
日期:2017-01-04 14:58:2415-16赛季CBA联赛之辽宁
日期:2017-01-15 09:42:512016科比退役纪念章
日期:2017-02-06 17:21:50黑曼巴
日期:2017-02-10 15:46:1215-16赛季CBA联赛之上海
日期:2017-03-18 10:14:5415-16赛季CBA联赛之青岛
日期:2017-03-18 22:00:44
发表于 2016-08-13 11:02 |显示全部楼层
本帖最后由 moperyblue 于 2016-08-13 11:32 编辑
  1. echo 'awk -F, 'function p(arr){for(i=1;i<=asort(arr);i++)printf (i==1?"":FS) arr[i];print""};{for(i=1;i<=NF;i++)if($i~/\//)b[$i]=$i;else a[$i]=$i}END{p(a);p(b)}'
复制代码
  1. echo '1.1.1.1,4.4.4.4/8,2.2.2.2,5.5.5.5/16,3.3.3.3,6.6.6.6/32'|tr ',' '\n'|sort -n|sed '/\//!{:a;N;/\n.*\//!{s/\n/,/;ta};P;D};:b;N;s/\n/,/;tb'
复制代码
1.1.1.1,2.2.2.2,3.3.3.3
4.4.4.4/8,5.5.5.5/16,6.6.6.6/32

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2016-08-13 12:02 |显示全部楼层
  1. echo '1.1.1.1,4.4.4.4/8,2.2.2.2,5.5.5.5/16,3.3.3.3,6.6.6.6/32'|perl -pe 'BEGIN{$r=qr/\d(?:\.\d){3}/}{while(s%((?:,$r/\d+)+)(,$r)(?!/)%$2$1%g){}s!,(?=$r/\d+)!"\n"!e}'
复制代码
1.1.1.1,2.2.2.2,3.3.3.3
4.4.4.4/8,5.5.5.5/16,6.6.6.6/32

论坛徽章:
307
程序设计版块每周发帖之星
日期:2016-04-08 00:41:33操作系统版块每日发帖之星
日期:2015-09-02 06:20:00每日论坛发贴之星
日期:2015-09-02 06:20:00程序设计版块每日发帖之星
日期:2015-09-04 06:20:00每日论坛发贴之星
日期:2015-09-04 06:20:00每周论坛发贴之星
日期:2015-09-06 22:22:00程序设计版块每日发帖之星
日期:2015-09-09 06:20:00程序设计版块每日发帖之星
日期:2015-09-19 06:20:00程序设计版块每日发帖之星
日期:2015-09-20 06:20:00每日论坛发贴之星
日期:2015-09-20 06:20:00程序设计版块每日发帖之星
日期:2015-09-22 06:20:00程序设计版块每日发帖之星
日期:2015-09-24 06:20:00
发表于 2016-08-13 12:38 |显示全部楼层
本帖最后由 sunzhiguolu 于 2016-08-13 12:40 编辑

如果不是特别在意结尾的 "," 的话, 试下:
  1. echo '1.1.1.1,4.4.4.4/8,2.2.2.2,5.5.5.5/16,3.3.3.3,6.6.6.6/32'|perl -pe 's{(.*)}{join ",",map {$_="\n$_" if(m~/~ and !$P++);$_} sort split(/,/,$1)}e'
复制代码
1.1.1.1,2.2.2.2,3.3.3.3,
4.4.4.4/8,5.5.5.5/16,6.6.6.6/32

论坛徽章:
2
luobin
日期:2016-06-17 17:46:36lufei
日期:2016-06-17 17:49:16
发表于 2016-08-13 13:11 |显示全部楼层
  1. awk -F, '{for(i=1;i<=NF;i++)if($i !~/\//)printf $i",";print ""}{for(i=1;i<=NF;i++)if($i ~/\//)printf $i",";print ""}' file | sed 's/,$//'
复制代码
1.1.1.1,2.2.2.2,3.3.3.3
4.4.4.4/8,5.5.5.5/16,6.6.6.6/32

论坛徽章:
11
射手座
日期:2015-08-11 16:10:26辰龙
日期:2015-08-11 16:11:11黑曼巴
日期:2016-04-26 16:58:40
发表于 2016-08-13 17:00 |显示全部楼层
  1. echo "1.1.1.1,4.4.4.4/8,2.2.2.2,5.5.5.5/16,3.3.3.3,6.6.6.6/32" | awk -F, '{for(i=1;i<=NF;i++){if($i~/\//)b=b?b","$i:$i;else a=a?a","$i:$i}}END{print a"\n"b}'
复制代码
只分类,没排序

论坛徽章:
1
操作系统版块每日发帖之星
日期:2016-07-05 06:20:00
发表于 2016-08-13 17:40 |显示全部楼层
#!/usr/bin/perl -w
while(<>){
@d1=(/(\d\.\d\.\d\.\d\/\d+)/g);
@d2=(/(\d\.\d\.\d\.\d)(?=,|$)/g);
foreach(@d1) {
   print $_,"\n";
}
print "\n";

foreach(@d2){
   print $_,"\n";
}
}

论坛徽章:
14
15-16赛季CBA联赛之辽宁
日期:2019-06-16 15:47:3515-16赛季CBA联赛之广夏
日期:2016-08-13 21:24:352015亚冠之武里南联
日期:2015-07-07 17:37:372015亚冠之萨济拖拉机
日期:2015-07-06 17:07:482015亚冠之全北现代
日期:2015-06-04 13:54:272015亚冠之城南
日期:2015-05-21 15:43:212015年亚洲杯之伊朗
日期:2015-04-25 18:20:362015年亚洲杯之伊朗
日期:2015-04-20 16:06:052015年亚洲杯之科威特
日期:2015-03-07 12:51:26丑牛
日期:2014-12-30 10:26:38申猴
日期:2014-09-28 22:40:18金牛座
日期:2014-09-13 21:12:22
发表于 2016-08-13 21:36 |显示全部楼层
  1. In [38]:  d
  2. Out[38]: '1.1.1.1,4.4.4.4/8,2.2.2.2,5.5.5.5/16,3.3.3.3,6.6.6.6/32'

  3. In [39]:

  4. In [39]: dd = d.split(',')

  5. In [40]: dd
  6. Out[40]: ['1.1.1.1', '4.4.4.4/8', '2.2.2.2', '5.5.5.5/16', '3.3.3.3', '6.6.6.6/32']

  7. In [41]: sorted(filter(lambda x: not  '/' in x, dd))
  8. Out[41]: ['1.1.1.1', '2.2.2.2', '3.3.3.3']

  9. In [43]: sorted(filter(lambda x: '/' in x, dd))
  10. Out[43]: ['4.4.4.4/8', '5.5.5.5/16', '6.6.6.6/32']
复制代码

论坛徽章:
145
技术图书徽章
日期:2013-10-01 15:32:13戌狗
日期:2013-10-25 13:31:35金牛座
日期:2013-11-04 16:22:07子鼠
日期:2013-11-18 18:48:57白羊座
日期:2013-11-29 10:09:11狮子座
日期:2013-12-12 09:57:42白羊座
日期:2013-12-24 16:24:46辰龙
日期:2014-01-08 15:26:12技术图书徽章
日期:2014-01-17 13:24:40巳蛇
日期:2014-02-18 14:32:59未羊
日期:2014-02-20 14:12:13白羊座
日期:2014-02-26 12:06:59
发表于 2016-08-13 22:34 |显示全部楼层
回复 1# 674949301

$ awk -F, '{s=$1;e=$2;for(n=3;n<NF;++n){s=s","$n;e=e","$++n}print s"\n"e}' FILE
1.1.1.1,2.2.2.2,3.3.3.3
4.4.4.4/8,5.5.5.5/16,6.6.6.6/32

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP