免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: bmne
打印 上一主题 下一主题

[文本处理] 请有点时间的大神给写个删除代码吧 [复制链接]

求职 : 技术支持/维
论坛徽章:
0
11 [报告]
发表于 2016-07-26 09:10 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
12 [报告]
发表于 2016-07-26 09:28 |只看该作者
回复 9# elu_ligao
回复 10# 99超人

哎呀!惭愧啊,没想到惊动这么多大神,工作非常繁忙,还抽出时间来回复我!

看来,我以后不会写代码不要紧,要先学会提问时让别人明白你求助的要求。(千万别自己明白,别人糊涂)

唉!无语中

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
13 [报告]
发表于 2016-07-26 09:43 |只看该作者
回复 9# elu_ligao


大神,我一楼的不动了。当个反面教材吧。提醒我以后注意



重新求助如下


源:

agn890        c57562653c783faeb8b6cd917ef258c1        j.aesiom
2d24100        fe2cc92855170913c530b9ae29ae7484        geanga.mebeom
x3h1993        014441af77a00e2dde25046dcc6ea218        gamngaan.om
3                   3                                                            3
4                   4                                                            4
a                   b                                                            c

要求:
只有在遇到第二列中是MD5码共32位的,就删除该整个行

最后剩余结果:
3                   3                                                            3
4                   4                                                            4
a                   b                                                            c


请帮助代码。感谢



   

论坛徽章:
29
程序设计版块每日发帖之星
日期:2016-02-29 06:20:0015-16赛季CBA联赛之天津
日期:2016-08-10 10:33:1115-16赛季CBA联赛之深圳
日期:2016-08-17 15:07:2015-16赛季CBA联赛之佛山
日期:2016-11-07 11:33:5015-16赛季CBA联赛之广夏
日期:2016-11-15 09:13:31CU十四周年纪念徽章
日期:2016-11-24 14:12:25极客徽章
日期:2016-12-07 14:03:4015-16赛季CBA联赛之深圳
日期:2016-12-07 17:15:2715-16赛季CBA联赛之北京
日期:2016-12-22 09:30:0115-16赛季CBA联赛之深圳
日期:2016-12-22 10:49:2115-16赛季CBA联赛之山西
日期:2017-02-10 09:05:3215-16赛季CBA联赛之同曦
日期:2017-02-27 14:19:08
14 [报告]
发表于 2016-07-26 09:53 |只看该作者
我上面给的代码是得到第二列md5的行, 你加个! 就行
  1. awk --re-interval '$2!~/[[:alnum:]]{32}/'
复制代码

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
15 [报告]
发表于 2016-07-26 09:55 |只看该作者
回复 9# elu_ligao


大神来了,我不能放过机会啊。抓紧求助。机会不能绝错过。感谢感谢


源:
yd        18        618@126.com
l        302        tol@sohu.com
7        hh        37@yahoo.com.cn
b9        q3        b@sina.com
c3        15        cl@163.com
q6        wn        mn@126.com
we      56      ju
d       u       89j


要求:第三列末尾,只要出现邮箱,比如 .com    .cn   就提取该整行


最终结果:

yd        18        618@126.com
l        302        tol@sohu.com
7        hh        37@yahoo.com.cn
b9        q3        b@sina.com
c3        15        cl@163.com
q6        wn        mn@126.com




   

论坛徽章:
2
子鼠
日期:2014-12-09 14:03:562015年亚洲杯之巴勒斯坦
日期:2015-03-31 10:49:39
16 [报告]
发表于 2016-07-26 10:05 |只看该作者
提示: 作者被禁止或删除 内容自动屏蔽

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
17 [报告]
发表于 2016-07-26 10:13 |只看该作者
本帖最后由 bmne 于 2016-07-26 10:53 编辑

回复 16# zriplj



谢谢,谢谢

我功力不行,我弄了个grep -P '.com$|.cn$'

结果只能提取这样的:(是不是要每一列末尾都要有邮箱才能提取呢?不懂我)      
n@1.com      hf@2.com    jh8@3.com
n@a.cn      hf@b.cn    jh8@c.cn


这样的不能提取(搞不懂我)

3   4   7@j.com
d   h   f@8.cn
   

论坛徽章:
29
程序设计版块每日发帖之星
日期:2016-02-29 06:20:0015-16赛季CBA联赛之天津
日期:2016-08-10 10:33:1115-16赛季CBA联赛之深圳
日期:2016-08-17 15:07:2015-16赛季CBA联赛之佛山
日期:2016-11-07 11:33:5015-16赛季CBA联赛之广夏
日期:2016-11-15 09:13:31CU十四周年纪念徽章
日期:2016-11-24 14:12:25极客徽章
日期:2016-12-07 14:03:4015-16赛季CBA联赛之深圳
日期:2016-12-07 17:15:2715-16赛季CBA联赛之北京
日期:2016-12-22 09:30:0115-16赛季CBA联赛之深圳
日期:2016-12-22 10:49:2115-16赛季CBA联赛之山西
日期:2017-02-10 09:05:3215-16赛季CBA联赛之同曦
日期:2017-02-27 14:19:08
18 [报告]
发表于 2016-07-26 10:30 |只看该作者
本帖最后由 elu_ligao 于 2016-07-26 10:31 编辑

应该都可以吧, 那个.com .cn 的点最好转义下 \.com  \.cn
  1. grep -P '^(\w+\s+){2}\w+@.*\.cn$|^(\w+\s+){2}\w+@.*\.com
复制代码
少了个 $' 最后

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
19 [报告]
发表于 2016-07-26 10:50 |只看该作者
本帖最后由 bmne 于 2016-07-26 10:51 编辑

回复 18# elu_ligao


谢谢大神

可能我没加转意\   出现我上面17楼说的情况。等会我再试去


   

论坛徽章:
31
程序设计版块每日发帖之星
日期:2016-02-06 06:20:00程序设计版块每日发帖之星
日期:2016-07-20 06:20:00程序设计版块每日发帖之星
日期:2016-07-26 06:20:00每日论坛发贴之星
日期:2016-07-26 06:20:00程序设计版块每日发帖之星
日期:2016-07-27 06:20:00每日论坛发贴之星
日期:2016-07-27 06:20:00程序设计版块每日发帖之星
日期:2016-07-28 06:20:00程序设计版块每日发帖之星
日期:2016-07-29 06:20:00程序设计版块每日发帖之星
日期:2016-08-02 06:20:00程序设计版块每日发帖之星
日期:2016-08-06 06:20:00程序设计版块每日发帖之星
日期:2016-08-08 06:20:00程序设计版块每日发帖之星
日期:2016-08-09 06:20:00
20 [报告]
发表于 2016-07-26 11:10 |只看该作者
回复 14# elu_ligao


还是你这个精准
awk --re-interval '$2!~/[[:alnum:]]{32}/'


这个容易把其它列中含有的md5码32位的也给删除掉
sed -r '/.+\s+\w{32}\s+.+/d'




   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP