免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1770 | 回复: 0
打印 上一主题 下一主题

使用Python检查Email地址列表 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2007-08-06 16:18 |只看该作者 |倒序浏览
有个email地址的列表文件,大概有6W多个吧,打算用来做群发的(每一行一个email地址),可是发现得到的email地址中有不少有问题,比如写成了
[email=aaa@aaa.com@ccc]aaa@aaa.com@ccc[/email]
,还有些包含特殊的字符等等

6W多行的文件,手动一个个的去进行检查,那要到猴年马月啊???


何不用程序来进行呢?刚好正在学习Python,用来练习一下也不错,以下的是简单的代码,只实现了简单的检查错误的功能,并把错误的地址写入一个文件中,如何用程序自动去纠正这些错误的地址,恐怕对我而言比较困难



# -*- coding: utf-8 -*-
import sys,os,re
filedir="/tmp/checkemail"
file=filedir+"/email_list"
errfile=filedir+"/error_email"
def checkemail():
    f=open(file,'r')
    lines=f.readlines()
    for line in lines:
        line1=line[:-1]
        p=re.compile(r'^[_a-z0-9-]+(\.[a-z0-9-]+)*@[a-z0-9-]+(\.[a-z0-9-]+)*(\.[a-z]{2,3})$')
        a=p.match(line)
        if a==None:
            err=open("errfile",'a')
            err.write(line)
                    else:
            pass
if __name__ == '__main__':
    checkemail()


本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/23834/showart_354682.html
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP