Chinaunix

标题: htmlparser的使用 [打印本页]

作者: oneouts    时间: 2012-08-03 11:35
标题: htmlparser的使用

#!/usr/bin/env python
import HTMLParser
import sys,urllib
class myparser(HTMLParser.HTMLParser):
        def __init__(self):
                HTMLParser.HTMLParser.__init__(self)
                self.recording=0
                self.data=[]
        def handle_starttag(self,tag,attributes):
                if tag=='span':
                        self.recording=1
                if self.recording==1:
                        for name,value in attributes:
                                if name=='class' and value == 'row_proxy_ip':
                                        print name
                                        self.recoding==2
        def handle_endtag(self,tag):
                if tag=='span' and self.recording:
                        self.recording=0
        def handle_data(self,data):
                if self.recording==2:
                        self.data.append(data)
html=myparser()
file1=(urllib.urlopen("http://www.proxcn.com/proxy-server-list").read())
html.feed(file1)
print html.data
html.close()


<td align="left"><span class="row_proxy_ip">110.139.99.207</span>
取出这个ip
这是我的代码 为什么不工作啊
谢谢指教

作者: oneouts    时间: 2012-08-03 12:04
没有人吗
大家帮帮忙
新手在这谢谢了
作者: linux_c_py_php    时间: 2012-08-03 12:37
你的那个网址无效啊.




欢迎光临 Chinaunix (http://bbs.chinaunix.net/) Powered by Discuz! X3.2