免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 13218 | 回复: 2
打印 上一主题 下一主题

BeautifulSoup如何查找class标签 [复制链接]

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 10:16:53
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-04-21 07:59 |只看该作者 |倒序浏览

<a href="aaaas"><img src="saaa"/></a>
<a class="url" href="saasa">那个分享第二份职业,两个月...</a>
<a href="aaaaa"><img src="aaaaa"></a>
<a class="url" href="aaaaa">兼职一:这是一个在手机上赚...</a>
<a href="saa">缁欐垜鍏虫敞鐨勪汉鍐欎俊</a>
<a href="saaaat">鍘绘垜鍏虫敞鐨勪汉鍒楄〃</a>

我想匹配出class="url"标签
  1. from bs4 import BeautifulSoup
  2. import string, re

  3. f = open('dy.html', 'r')
  4. html = f.readlines()
  5. soup = BeautifulSoup(string.join(html, ''))
  6. for link in soup.find_all('a'):
  7.     print link.find(class_='url')
  8.     print link.find(attrs={'class','url'})
复制代码
都显示None

论坛徽章:
1
2015年迎新春徽章
日期:2015-03-04 10:16:53
2 [报告]
发表于 2015-04-21 09:41 |只看该作者
本帖最后由 cc7756789w 于 2015-04-21 09:42 编辑

问题解决了,得这么搞

  1. soup = BeautifulSoup(self.response.read())
  2. tag = soup.find_all('span', attrs={'class':'from'})
  3. tag2 =  soup.find_all('a', attrs={'class':'url'})
复制代码

论坛徽章:
0
3 [报告]
发表于 2015-05-14 14:45 |只看该作者
回复 2# cc7756789w

我也刚学,找class感觉最爽了。嗖嗖快


# -*- coding: UTF-8 -*-

from bs4 import BeautifulSoup

the_html="""
<a href="aaaas"><img src="saaa"/></a>
<a class="url" href="saasa">那个分享第二份职业,两个月...</a>
<a href="aaaaa"><img src="aaaaa"></a>
<a class="url" href="aaaaa">兼职一:这是一个在手机上赚...</a>
<a href="saa">缁欐垜鍏虫敞鐨勪汉鍐欎俊</a>
<a href="saaaat">鍘绘垜鍏虫敞鐨勪汉鍒楄〃</a>
"""

soup=BeautifulSoup(the_html)

for one in soup(class_="url"):
    print one
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP