Chinaunix

标题: htmlparser的使用 [打印本页]

作者: oneouts 时间: 2012-08-03 11:35
标题: htmlparser的使用

#!/usr/bin/env python
import HTMLParser
import sys,urllib
class myparser(HTMLParser.HTMLParser):
def __init__(self):
HTMLParser.HTMLParser.__init__(self)
self.recording=0
self.data=[]
def handle_starttag(self,tag,attributes):
if tag=='span':
self.recording=1
if self.recording==1:
for name,value in attributes:
if name=='class' and value == 'row_proxy_ip':
print name
self.recoding==2
def handle_endtag(self,tag):
if tag=='span' and self.recording:
self.recording=0
def handle_data(self,data):
if self.recording==2:
self.data.append(data)
html=myparser()
file1=(urllib.urlopen("http://www.proxcn.com/proxy-server-list").read())
html.feed(file1)
print html.data
html.close()

<td align="left"><span class="row_proxy_ip">110.139.99.207</span>
取出这个ip
这是我的代码为什么不工作啊
谢谢指教

作者: oneouts 时间: 2012-08-03 12:04
没有人吗
大家帮帮忙
新手在这谢谢了

作者: linux_c_py_php 时间: 2012-08-03 12:37
你的那个网址无效啊.

欢迎光临 Chinaunix (http://bbs.chinaunix.net/)