免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1288 | 回复: 0
打印 上一主题 下一主题

xpath处理出现问题 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2015-05-27 21:33 |只看该作者 |倒序浏览
小白在抓学校图书馆的数据,然后遇到一个标签,使用xpath提取不了,求大侠帮忙
<tr>
                                  <td><a href="javascript:void(0)" title="点击可查看此地点的详细介绍" onclick='showLibInfo("211")'>龙洞人文科学书库</a>
                                 
                                  </td>
                                 
                                  <td>I206/Z83</td>
                                  <td>A3180875</td>
                                  <td class="tbr"> </td>
                                  <td> </td>
                                  <td>
                                      可供出借
                                      
                                  </td>
                                  <td>中文图书</td>
                           </tr>
上面这一段 使用
for sel in response.xpath("//tbody/tr"):
     print sel.xpath('td[x]/text()').extract()
其中  x表示 2,3,7等可以提取到文字节点  但是x为6时,提取不了
显示结果是  '\r\n             (这里是一个长的空白串)  '  
请问大神如何解决?
难道需要先把这些文本全部去空格处理?
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP