免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1633 | 回复: 3
打印 上一主题 下一主题

使用BeautifulSoup中的疑问 [复制链接]

论坛徽章:
2
2015年迎新春徽章
日期:2015-03-04 10:01:44程序设计版块每日发帖之星
日期:2015-06-28 22:20:00
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-12-17 22:43 |只看该作者 |倒序浏览
使用BeautifulSoup抓取网页内容,然后利用findAll功能查找class="nav customfield_10130"的项
soup=BeautifulSoup(result.read())
contents=soup.findAll(class="nav customfield_10130")
for c in contents:
    print c.strings

但是系统执行报错,提示class关键字错误,如果规避呢

论坛徽章:
0
2 [报告]
发表于 2015-12-18 09:23 |只看该作者
{"class":"nava customfield_1-130"}

论坛徽章:
2
2015年迎新春徽章
日期:2015-03-04 10:01:44程序设计版块每日发帖之星
日期:2015-06-28 22:20:00
3 [报告]
发表于 2015-12-21 21:12 |只看该作者
回复 2# huangxiaohen

html内容如下:
            <div class="twixi-wrap verbose">
                <a href="#" class="twixi"><span class="icon twixi-opened"><span>隐藏</span></span></a>
                <div class="flooded">
                    <p>  test</p>

                </div>

使用字典得到的结果还是[]
contents=soup.findAll({'class':"twixi-wrap verbose"})
print contents  

论坛徽章:
0
4 [报告]
发表于 2015-12-22 09:29 |只看该作者
本帖最后由 huangxiaohen 于 2015-12-22 09:30 编辑

回复 3# maple412

findAll('div', {'class':.....})是这样的,如果再抓不到,
那就说明代码是js加载的, 所以urllib2或者requests根本抓不到代码。

   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP