免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1943 | 回复: 8
打印 上一主题 下一主题

这个程序该咋写 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-03-06 13:57 |只看该作者 |倒序浏览
shell程序如何才能从一个目录中的所有html文件中查找到所有的不重复的邮件地址,结果输出到文本文件中

论坛徽章:
0
2 [报告]
发表于 2006-03-06 17:45 |只看该作者
up

论坛徽章:
1
荣誉会员
日期:2011-11-23 16:44:17
3 [报告]
发表于 2006-03-06 18:30 |只看该作者

水平怎么提高不了啊,谁有秘诀?

秘诀全在十三问/十二篇里

论坛徽章:
0
4 [报告]
发表于 2006-03-06 18:46 |只看该作者

回复 2楼 sunboy 的帖子

[kensoul@savage kensoul]$ cat 1.html
email 1111@ya.com
email 2222@ll.com
[kensoul@savage kensoul]$ cat 2.html
email 1111@yahoo.com
email 2222@ll.com
email 3333@ll.com
[kensoul@savage kensoul]$ awk '/@/ {print FILENAME,$0}' *.html|awk '{print $3}'|sort|uniq>1.lst
[kensoul@savage kensoul]$cat 1.lst
1111@ya.com
1111@yahoo.com
2222@ll.com
3333@ll.com

论坛徽章:
0
5 [报告]
发表于 2006-03-06 20:15 |只看该作者
html格式的恐怕不能如上文来过滤吧

论坛徽章:
0
6 [报告]
发表于 2006-03-06 21:01 |只看该作者

回复 5楼 sunboy 的帖子

动机不纯乎?

  1. #!/bin/bash
  2. echo "输入目标目录:"
  3. DIR=""
  4. read DIR
  5. if [[ -z "$DIR" ]]
  6. then  echo "输入为空,退出";exit 1
  7. else  echo "进入目标目录"
  8.         cd "$DIR"
  9.         ls *.html >/dev/null || echo "没找到html文件,退出" && exit 1
  10.         for HTMLFILE in `ls *.html`
  11.         do
  12.                 sed  's/\"/\n/g' $HTMLFILE|sed -ne '/mailto/p' >> mailto
  13.         done
  14.         sort mailto|uniq|sed -ne 's/mailto://p;/^$/d' > maillist ;rm mailto
  15. fi
复制代码

论坛徽章:
0
7 [报告]
发表于 2006-03-08 01:24 |只看该作者
赞楼上的.哈哈

论坛徽章:
0
8 [报告]
发表于 2006-03-09 12:10 |只看该作者
哈哈,当然动机不纯啦,谢谢

论坛徽章:
0
9 [报告]
发表于 2006-03-13 16:13 |只看该作者
剔除重复的列就可以了,输出到另外一个文件
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP