- 论坛徽章:
- 4
|
上周 要从域名里面获取顶级域名 然后找啊找 发现好像没多少
结果自己写了个 这个算法是俺们组长想出来的
域名 分为网络顶级域名 也就是下面那个字典里的几个 然后.cn什么的之类的 地域性质 顶级域名
然后地域性质的域名可能会跟在网络顶级域名的后面 
具体怎么推 自己看代码
def getHost(domain):
#从域名获取顶级域名
#不带http://比喻www.baidu.com或者baidu.com
DomainSuffix = {'info': None, 'coop': None, 'mil': None,
'int': None, 'xxx': None, 'pro': None, 'aero': None, 'idv': None,
'biz': None, 'edu': None, 'org': None, 'net': None, 'gov': None,
'com': None, 'museum': None, 'name': None}
Result = []
if domain.count('.') == 1:
return domain
PointSplitResult = domain.split('.')
if len(filter(lambda x: not x.isdigit(), PointSplitResult)) == 0:
return domain
if DomainSuffix.has_key(PointSplitResult[-1].lower()):
Result = PointSplitResult[-2:]
else:
if DomainSuffix.has_key(PointSplitResult[-2].lower()):
Result = PointSplitResult[-3:]
else:
Result = PointSplitResult[-2:]
return '.'.join(Result) |
|
|