免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1494 | 回复: 4
打印 上一主题 下一主题

htmlparser [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2012-08-06 19:47 |只看该作者 |倒序浏览
<span class="row_proxy_port"><a href="http://www.proxy.cn/proxy-server-list/port-3128/" title="proxy list - port 3128">3122</a>


使用html如何取端口号?
tag=span, name=title,但是这个value等于什么啊?
proxy list - port 3122  这个端口好会变得3122
比如下一个也许就是proxy list - port 9090
htmlparser 能不能 写成这样的形式啊value=proxy list - port *  

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
2 [报告]
发表于 2012-08-06 23:26 |只看该作者
正则直接取出来就行了啊.
  1. # -*- coding:utf-8 -*-

  2. import re

  3. str = '<span class="row_proxy_port"><a href="http://www.proxy.cn/proxy-server-list/port-3128/" title="proxy list - port 3128">3122</a>'
  4. ports = re.findall(r'<a.*?title="proxy list - port (\d+)"', str, re.S | re.I)
  5. print ports

  6. ['3128']

复制代码

论坛徽章:
0
3 [报告]
发表于 2012-08-07 11:23 |只看该作者
谢谢你的帮助
请问python的正则看什么书好呢?

论坛徽章:
4
水瓶座
日期:2013-09-06 12:27:30摩羯座
日期:2013-09-28 14:07:46处女座
日期:2013-10-24 14:25:01酉鸡
日期:2014-04-07 11:54:15
4 [报告]
发表于 2012-08-07 11:25 |只看该作者
Python manual就可以... 我搞PHP的, 已经用了很久了..回复 3# oneouts


   

论坛徽章:
0
5 [报告]
发表于 2012-08-07 12:16 |只看该作者
xiexie
xiexie
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP