免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 6538 | 回复: 26
打印 上一主题 下一主题

{解决}辛苦大家,问一下,如何提取文本文件中的邮件信息?谢谢了 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-03-21 22:54 |只看该作者 |倒序浏览
本帖最后由 新手刚来 于 2012-03-22 10:19 编辑

stock.fir.me@hotmail.it
gamer9027@gmail.com
t.grandguillotte@laposte.net
dskhfsdjk@yahoo.com.cn
dskjhk—fskl@yahoo.cn
fgsdkj_fdsh@yahoo.com.cn

文本中有大概1万多条右键信息,邮箱格式很多,问一下高手如何全部提取出来,怎么操作,谢谢了,辛苦。

论坛徽章:
71
15-16赛季CBA联赛之同曦
日期:2018-08-23 15:41:42辰龙
日期:2014-08-15 09:07:43狮子座
日期:2014-06-03 13:55:33亥猪
日期:2014-06-02 11:17:08巨蟹座
日期:2014-05-06 10:02:03午马
日期:2014-05-04 08:18:27亥猪
日期:2014-04-29 11:11:32技术图书徽章
日期:2014-04-24 15:51:26技术图书徽章
日期:2014-04-17 11:01:53辰龙
日期:2014-04-15 12:45:46亥猪
日期:2014-04-11 09:06:23射手座
日期:2014-04-01 15:28:10
2 [报告]
发表于 2012-03-21 23:09 |只看该作者
本帖最后由 zhaopingzi 于 2012-03-21 23:18 编辑


  1. grep  -oP "\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*" file
复制代码

论坛徽章:
5
未羊
日期:2014-08-04 16:15:21天秤座
日期:2014-08-13 13:52:372015年辞旧岁徽章
日期:2015-03-03 16:54:152015年迎新春徽章
日期:2015-03-04 09:56:112015亚冠之浦和红钻
日期:2015-06-29 15:30:48
3 [报告]
发表于 2012-03-21 23:10 |只看该作者
我怎么觉得这些邮箱都是合法的呢
邮箱中的用户名允许出现._-这些符号的吧

论坛徽章:
0
4 [报告]
发表于 2012-03-21 23:21 |只看该作者
本帖最后由 新手刚来 于 2012-03-21 23:22 编辑
zhaopingzi 发表于 2012-03-21 23:09


你好,grep -op 参数 文件名 输出后没有东西啊呵呵,麻烦在指点下

假如我文件名是111.csv格式怎么写,谢谢兄弟了

我的目的是提取出来这些信息,然后发邮件

论坛徽章:
71
15-16赛季CBA联赛之同曦
日期:2018-08-23 15:41:42辰龙
日期:2014-08-15 09:07:43狮子座
日期:2014-06-03 13:55:33亥猪
日期:2014-06-02 11:17:08巨蟹座
日期:2014-05-06 10:02:03午马
日期:2014-05-04 08:18:27亥猪
日期:2014-04-29 11:11:32技术图书徽章
日期:2014-04-24 15:51:26技术图书徽章
日期:2014-04-17 11:01:53辰龙
日期:2014-04-15 12:45:46亥猪
日期:2014-04-11 09:06:23射手座
日期:2014-04-01 15:28:10
5 [报告]
发表于 2012-03-21 23:25 |只看该作者
新手刚来 发表于 2012-03-21 23:21
你好,grep -op 参数 文件名 输出后没有东西啊呵呵,麻烦在指点下

假如我文件名是111.csv格式怎么写 ...

  1. $cat file
  2. stock.fir.me@hotmail.it
  3. gamer9027@gmail.com
  4. t.grandguillotte@laposte.net
  5. dskhfsdjk@yahoo.com.cn
  6. dfaf@d
  7. 1.cn
  8. 334.efrefre
  9. @dfsfag
  10. fdsafda@u.cn
  11. afda_efre-2@163.com
  12. stock.firme@hotmail.it
  13. gamer9027@gmail.com
  14. t.grandguillotte@laposte.net
  15. dskhfsdjk@yahoo.com.cn
  16. dskjhk—fskl@yahoo.cn
  17. fgsdkj_fdsh@yahoo.com.cn


  18. $grep  -oP "\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*" file
  19. stock.fir.me@hotmail.it
  20. gamer9027@gmail.com
  21. t.grandguillotte@laposte.net
  22. dskhfsdjk@yahoo.com.cn
  23. fdsafda@u.cn
  24. afda_efre-2@163.com
  25. stock.firme@hotmail.it
  26. gamer9027@gmail.com
  27. t.grandguillotte@laposte.net
  28. dskhfsdjk@yahoo.com.cn
  29. fskl@yahoo.cn
  30. fgsdkj_fdsh@yahoo.com.cn
复制代码

论坛徽章:
0
6 [报告]
发表于 2012-03-21 23:29 |只看该作者
zhaopingzi 发表于 2012-03-21 23:25




晕,我就是这样执行的,cat执行后出来文件信息,grep执行后没反映啊

论坛徽章:
33
ChinaUnix元老
日期:2015-02-02 08:55:39CU十四周年纪念徽章
日期:2019-08-20 08:30:3720周年集字徽章-周	
日期:2020-10-28 14:13:3020周年集字徽章-20	
日期:2020-10-28 14:04:3019周年集字徽章-CU
日期:2019-09-08 23:26:2519周年集字徽章-19
日期:2019-08-27 13:31:262016科比退役纪念章
日期:2022-04-24 14:33:24
7 [报告]
发表于 2012-03-21 23:30 |只看该作者
回复 4# 新手刚来


把你的csv文件压缩一下传上来看看

论坛徽章:
0
8 [报告]
发表于 2012-03-21 23:34 |只看该作者
谢谢楼上的兄弟们,我就截取了一点方便上传

Book1.zip

809 Bytes, 下载次数: 38

论坛徽章:
71
15-16赛季CBA联赛之同曦
日期:2018-08-23 15:41:42辰龙
日期:2014-08-15 09:07:43狮子座
日期:2014-06-03 13:55:33亥猪
日期:2014-06-02 11:17:08巨蟹座
日期:2014-05-06 10:02:03午马
日期:2014-05-04 08:18:27亥猪
日期:2014-04-29 11:11:32技术图书徽章
日期:2014-04-24 15:51:26技术图书徽章
日期:2014-04-17 11:01:53辰龙
日期:2014-04-15 12:45:46亥猪
日期:2014-04-11 09:06:23射手座
日期:2014-04-01 15:28:10
9 [报告]
发表于 2012-03-21 23:37 |只看该作者
本帖最后由 zhaopingzi 于 2012-03-21 23:41 编辑

  1. $ grep  -oP "\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*"  Book1.csv
  2. wbwu@sia.cn
  3. kaiserschmarn9742@gmx-topmail.de
  4. kaiserschmarn9742@gmx-topmail.de
  5. nico_juden@hotmail.com
  6. nico_juden@hotmail.com
  7. overwelming@gmx-topmail.de
  8. overwelming@gmx-topmail.de
  9. dkelum9@hotmail.com
  10. dkelum9@hotmail.com
  11. yantony@ig.com.br
  12. yantony@ig.com.br
  13. carsten@carstencgn.com
  14. carsten@carstencgn.com
  15. dreamteam8000@gmx.de
  16. dreamteam8000@gmx.de
  17. gtop2012@gmail.com
  18. gtop2012@gmail.com
  19. charisma8@y7mail.com
  20. charisma8@y7mail.com
  21. liuyuanchang@hotmail.com
  22. liuyuanchang@hotmail.com
  23. paemer02@yahoo.com
  24. paemer02@yahoo.com
复制代码

2.GIF (13.23 KB, 下载次数: 21)

2.GIF

论坛徽章:
0
10 [报告]
发表于 2012-03-21 23:41 |只看该作者
本帖最后由 新手刚来 于 2012-03-21 23:49 编辑
zhaopingzi 发表于 2012-03-21 23:37


这个截取的book1我实验没有问题,但是原来的那个文件还是不行 grep 执行后没反映,又调到从新输入的状态下了,是不是csv的文件太大了?

您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP