免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
论坛 程序设计 Python python
最近访问板块 发新帖
查看: 2113 | 回复: 6
打印 上一主题 下一主题

python [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2013-06-17 01:16 |只看该作者 |倒序浏览
本帖最后由 gdp8899 于 2013-07-11 00:14 编辑

<tbody>
<tr><td><strong>报表日期</strong></td><td style='text-align:right;'>2013-03-31</td></tr>
<tr></tr>
<tr><td width='150px' style='font-weight:bold'><a target='_blank' href='/corp/view/vFD_FinanceSummaryHistory.php?stockid=002024&type=cinst61'>一、营业总收入</a></td><td style='text-align:right;'>27,200,800,000.00</td></tr>
<tr><td style='padding-left:30px' width='150px'><a target='_blank' href='/corp/view/vFD_FinanceSummaryHistory.php?stockid=002024&type=cinst1'>营业收入</a></td><td style='text-align:right;'>27,200,800,000.00</td></tr>
<tr><td style='padding-left:30px' width='150px'><a target='_blank' href='/corp/view/vFD_FinanceSummaryHistory.php?stockid=002024&type=cinst62'>利息收入</a></td><td>--</td></tr>
<tr><td style='padding-left:30px' width='150px'><a target='_blank' href='/corp/view/vFD_FinanceSummaryHistory.php?stockid=002024&type=cinst63'>已赚保费</a></td><td>--</td></tr>
</tbody>
在上面的代码中,我想用BeautifulSoup的语言同时抓取数值“27,200,800,000.00”与“--”,该怎么做?望大神出手相助~

论坛徽章:
9
2015亚冠之阿尔纳斯尔
日期:2015-09-10 16:21:162015亚冠之塔什干火车头
日期:2015-07-01 16:23:022015年亚洲杯之巴勒斯坦
日期:2015-04-20 17:19:46子鼠
日期:2014-11-13 09:51:26未羊
日期:2014-08-28 18:13:36技术图书徽章
日期:2014-02-21 09:30:15酉鸡
日期:2014-01-14 11:12:49天蝎座
日期:2013-12-09 17:56:53平安夜徽章
日期:2015-12-26 00:06:30
2 [报告]
发表于 2013-06-17 18:06 |只看该作者
  1. #!/usr/bin/env python
  2. #coding=utf-8
  3. txt="""
  4. <tbody>
  5. <tr><td><strong>报表日期</strong></td><td style='text-align:right;'>2013-03-31</td></tr>
  6. <tr></tr>
  7. <tr><td width='150px' style='font-weight:bold'><a target='_blank' href='/corp/view/vFD_FinanceSummaryHistory.php?stockid=002024&type=cinst61'>一、营业总收入</a></td><td style='text-align:right;'>27,200,800,000.00</td></tr>
  8. <tr><td style='padding-left:30px' width='150px'><a target='_blank' href='/corp/view/vFD_FinanceSummaryHistory.php?stockid=002024&type=cinst1'>营业收入</a></td><td style='text-align:right;'>27,200,800,000.00</td></tr>
  9. <tr><td style='padding-left:30px' width='150px'><a target='_blank' href='/corp/view/vFD_FinanceSummaryHistory.php?stockid=002024&type=cinst62'>利息收入</a></td><td>--</td></tr>
  10. <tr><td style='padding-left:30px' width='150px'><a target='_blank' href='/corp/view/vFD_FinanceSummaryHistory.php?stockid=002024&type=cinst63'>已赚保费</a></td><td>--</td></tr>
  11. </tbody>
  12. """
  13. import re
  14. from BeautifulSoup import BeautifulSoup
  15. soup=BeautifulSoup(''.join(txt))
  16. i=soup.findAll('td',{'style':'padding-left:30px'})
  17. for j in i:
  18.         print j.findNextSiblings('td')[0].contents
复制代码

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-10-02 06:20:00IT运维版块每月发帖之星
日期:2015-09-11 19:30:52IT运维版块每周发帖之星
日期:2015-09-11 19:20:31IT运维版块每日发帖之星
日期:2015-08-26 06:20:00每日论坛发贴之星
日期:2015-08-20 06:20:00IT运维版块每日发帖之星
日期:2015-08-20 06:20:002015年辞旧岁徽章
日期:2015-03-03 16:54:15金牛座
日期:2014-05-04 16:58:09双子座
日期:2013-12-17 16:44:37辰龙
日期:2013-11-22 15:20:59狮子座
日期:2013-11-18 22:55:08射手座
日期:2013-11-12 10:54:26
3 [报告]
发表于 2013-06-17 19:05 来自手机 |只看该作者
我想你没研究之前你那个同样问题的答案吧?

论坛徽章:
0
4 [报告]
发表于 2013-06-18 19:57 |只看该作者
回复 2# HH106
那请问如果我要把"27,200,800,000.00"赋值于a,"--"赋值于b,该怎么办,因为我取值的时候发生了只取第一列的奇怪现象
[u'27,200,800,000.00']
[u'--']
[u'--']
[u'--']
[u'--']
   进行操作 for i in a:
               j=i.findNextSiblings('td')[0].contents
               for i in j:
                    print i[0]
   之后输出
2
-
-
-
-
   

论坛徽章:
0
5 [报告]
发表于 2013-06-19 08:37 |只看该作者
wenhq 发表于 2013-06-17 19:05
我想你没研究之前你那个同样问题的答案吧?
这也是我想说的。
和之前问题,可以说一样,所以,对于不用心的人,懒得再回复同样的问题。

论坛徽章:
16
IT运维版块每日发帖之星
日期:2015-10-02 06:20:00IT运维版块每月发帖之星
日期:2015-09-11 19:30:52IT运维版块每周发帖之星
日期:2015-09-11 19:20:31IT运维版块每日发帖之星
日期:2015-08-26 06:20:00每日论坛发贴之星
日期:2015-08-20 06:20:00IT运维版块每日发帖之星
日期:2015-08-20 06:20:002015年辞旧岁徽章
日期:2015-03-03 16:54:15金牛座
日期:2014-05-04 16:58:09双子座
日期:2013-12-17 16:44:37辰龙
日期:2013-11-22 15:20:59狮子座
日期:2013-11-18 22:55:08射手座
日期:2013-11-12 10:54:26
6 [报告]
发表于 2013-06-19 12:47 |只看该作者
@crifanagree! 呵呵。

论坛徽章:
0
7 [报告]
发表于 2013-07-10 22:22 |只看该作者
回复 6# wenhq
我自己笨,让两位见笑了……


   
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP