免费注册	查看新帖 \|


平台论坛博客文库

› 论坛 › 程序设计 › Python › 字浮串处理

12 / 2 页下一页

最近访问板块

发新帖

查看: 3168 | 回复: 11

上一主题

下一主题

字浮串处理 [复制链接]

论坛徽章:: 1

2015年迎新春徽章
日期:2015-03-04 09:49:03

电梯直达

跳转到指定楼层

1楼 [收藏(0)] [报告]

发表于 2010-03-18 00:13 |只看该作者 |倒序浏览

我想把 >30</font></b> 字浮串处理只保留数字
就是只要30 剩下的都不要请问python 有这样函数吗?

还是有什么好方法处理

谢谢

文库|博客

论坛徽章:: 0

2楼 [报告]

发表于 2010-03-18 00:15 |只看该作者

用re吧

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 1

2015年迎新春徽章
日期:2015-03-04 09:49:03

3楼 [报告]

发表于 2010-03-18 00:47 |只看该作者

本帖最后由 shihyu 于 2010-03-18 01:04 编辑

p=re.compile('(>[0-9]+</font></b>)')
m=p.search(page).group()
k=re.sub(r'\D', '', m)
print k

复制代码

目前是想到这要处理不知道有没有更好方法

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

4楼 [报告]

发表于 2010-03-18 01:04 |只看该作者

>>> a = '</font> + <b><font color="#FF0000">30</font></b>'
>>> import re
>>> p = re.compile('>([0-9]+)</font>')
>>> m = p.search(a)
>>> m
<_sre.SRE_Match object at 0xb7f64c20>
>>> m.groups()
('30',)

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 1

2015年迎新春徽章
日期:2015-03-04 09:49:03

5楼 [报告]

发表于 2010-03-18 01:19 |只看该作者

本帖最后由 shihyu 于 2010-03-18 01:21 编辑

# -*- coding: utf-8 -*-
import urllib
import re
def fetch(url):
page=urllib.urlopen(url).read()
print page
p=re.compile('([0-9]+-[0-9]+-[0-9]+)')
m=p.search(page).group()
print u"开奖日期:" + m
pat=re.compile(r"\d+\s+\d+\s+\d+\s+\d+\s+\d+\s+\d+")
cont=pat.search(page).group(0)
print u"开奖号码:" + cont
p=re.compile('(>[0-9]+</font></b>)')
m=p.search(page).group()
k=re.sub(r'\D', '', m)
print u"特别号码:" + k
url = "http://lotto.arclink.com.tw/kj_6.html"
fetch(url)
raw_input()

复制代码

我现在已经可以处理第一笔号码

请问要怎么让代码往下再处理? 代码要怎么写?

谢谢

234.jpg (65.78 KB, 下载次数: 17)

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

6楼 [报告]

发表于 2010-03-18 01:28 |只看该作者

url 访问不了

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 1

2015年迎新春徽章
日期:2015-03-04 09:49:03

7楼 [报告]

发表于 2010-03-18 03:28 |只看该作者

url 可以访问

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

8楼 [报告]

发表于 2010-03-18 08:07 |只看该作者

re.findall(r'\d+','>30</font></b>')

复制代码

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

9楼 [报告]

发表于 2010-03-18 09:23 |只看该作者

回复 7# shihyu

奇怪了，我访问不了url，其他人可以访问？

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

论坛徽章:: 0

10楼 [报告]

发表于 2010-03-18 16:33 |只看该作者

楼主，前面我给你出了个题，看来还没研究到位啊。

我公布下你的所有的正则吧

(\d+\s+\d+\s+\d+\s+\d+\s+\d+\s+\d+).*?\>(\d+)
re.compile(r"(\d+\s+\d+\s+\d+\s+\d+\s+\d+\s+\d+).*?\>(\d+)")

然后取gourp(1),group(2)
就是
group(1)=39 22 04 01 14 18
group(2)=48

这次是把所有的数字加最后一个特别数字都给你了

实战分享：从技术角度谈机器学习入门| 【大话IT】RadonDB低门槛向MySQL集群下战书 | ChinaUnix打赏功能已上线！ | 新一代分布式关系型数据库RadonDB知多少？

12 / 2 页下一页

发新帖

Chinaunix › 论坛 › 程序设计 › Python › 字浮串处理

北京盛拓优讯信息技术有限公司. 版权所有京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号：11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员联系我们：huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP