免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 2144 | 回复: 9
打印 上一主题 下一主题

请有经验的朋友帮忙看看如何筛选符合条件的行 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2005-06-13 08:19 |只看该作者 |倒序浏览
文件内容:
8880000
8880001
.
.
.
.
8889998
8889999

共10000行。

筛选要求:
1、筛选出第4、5位不相同并且第6、7位也不相同的号码,例如:8881000(不符合)、8881121(不符合)、8881012(符合);8881003(符合)
2、在满足第一个要求的前提下,要求第4、5位和第6、7位不能相同,例如:8882121(不符合)、8883545(符合)、8882123(符合)

请大家指点一下思路。

ps:这个筛选问题只是一系列筛选要求中的一个而已,其他的我基本解决了,如果大家有兴趣我也可以贴上来。

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
2 [报告]
发表于 2005-06-13 08:37 |只看该作者

请有经验的朋友帮忙看看如何筛选符合条件的行

  1. sed 's/\(...\)\(.\)\(.\)\(.\)\(.\)/\1 \2 \3 \4 \5/g' file|awk '{if($2!=$3){if($4!=$5)print}}'|sed 's/ //g'
复制代码

  1. sed 's/\(...\)\(..\)\(..\)/\1 \2 \3/g' file|awk '{if($2!=$3)print}'|sed 's/ //g'
复制代码

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
3 [报告]
发表于 2005-06-13 08:48 |只看该作者

请有经验的朋友帮忙看看如何筛选符合条件的行

sed '/\(.\)\1..$/d; /\(.\)\1$/d; /\(..\)\1$/d'

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
4 [报告]
发表于 2005-06-13 08:51 |只看该作者

请有经验的朋友帮忙看看如何筛选符合条件的行

gawk -F '' '$4!=$5&&$6!=$7&&$4$5!=$6$7'

论坛徽章:
0
5 [报告]
发表于 2005-06-13 12:16 |只看该作者

请有经验的朋友帮忙看看如何筛选符合条件的行

崇拜ing...

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
6 [报告]
发表于 2005-06-13 12:26 |只看该作者

请有经验的朋友帮忙看看如何筛选符合条件的行

[quote]原帖由 "waker"]sed '/\(.\)\1..$/d; /\(.\)\1$/d; /\(..\)\1$/d'[/quote 发表:



这个用法,第一次见,解释一下?  

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
7 [报告]
发表于 2005-06-13 14:11 |只看该作者

请有经验的朋友帮忙看看如何筛选符合条件的行

将 \( 和 \) 之间的表达式定义为“组”(group),并且将匹配这个表达式的字符保存到一个临时区域(一个正则表达式中最多可以保存9个),它们可以用 \1 到\9 的符号来引用。

看来最基本的表达式语法没仔仔细细的看

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
8 [报告]
发表于 2005-06-13 14:40 |只看该作者

请有经验的朋友帮忙看看如何筛选符合条件的行

sed '/\(.\)
  1. \1..$
复制代码
/d; /\(.\)\1$/d; /\(..\)\1$/d'


是这个不明白。。。。。定义组偶知道,前面偶也用了   为啥偶这么笨呢

论坛徽章:
8
摩羯座
日期:2014-11-26 18:59:452015亚冠之浦和红钻
日期:2015-06-23 19:10:532015亚冠之西悉尼流浪者
日期:2015-08-21 08:40:5815-16赛季CBA联赛之山东
日期:2016-01-31 18:25:0515-16赛季CBA联赛之四川
日期:2016-02-16 16:08:30程序设计版块每日发帖之星
日期:2016-06-29 06:20:002017金鸡报晓
日期:2017-01-10 15:19:5615-16赛季CBA联赛之佛山
日期:2017-02-27 20:41:19
9 [报告]
发表于 2005-06-13 15:19 |只看该作者

请有经验的朋友帮忙看看如何筛选符合条件的行

两个字符到行尾  
是真的mocou么?

论坛徽章:
1
荣誉版主
日期:2011-11-23 16:44:17
10 [报告]
发表于 2005-06-13 16:38 |只看该作者

请有经验的朋友帮忙看看如何筛选符合条件的行

有时转不过弯来也是正常的嘛。
明白了

sed '/\(.\)\1..$/d; /\(.\)\1$/d; /\(..\)\1$/d'

\(.\)\1..$的\(.\)是倒数第四位,\1引用第四位,相当于倒数第三第四重复。

55555555555

原来可以这样用啊。偶一直以为\1不能这样直接用。。。。。。。
     笨死了
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP