免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
123下一页
最近访问板块 发新帖
查看: 6137 | 回复: 21
打印 上一主题 下一主题

那个SB, 总删我帖子啊 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2011-07-26 12:18 |只看该作者 |倒序浏览
TMD, 人渣啊, 为什么要删 "如何解析出一个网页中特定table的特定内容?"这个帖子? 出来给我解释清楚!

论坛徽章:
3
CU十二周年纪念徽章
日期:2013-10-24 15:41:34狮子座
日期:2014-03-27 15:44:382015年辞旧岁徽章
日期:2015-03-03 16:54:15
2 [报告]
发表于 2011-07-26 12:52 |只看该作者
CU里面是有些垃圾版主,我发个笑话都被send_linux给删了,人渣

论坛徽章:
0
3
发表于 2011-07-26 14:05
NND, 气愤的解决问题了, 再帖出来, 看看我们的铁道部是否还会重现!

html中的一个table:

<table class="table-list" cellpadding="0" cellspacing="0" border="0">
   <tr class="own">
       <td class="first"> <a href="http://www.baidu.com" target="_blank"><em>百度</em></a> </td>
       <td class="second"><a href="http://news.baidu.com" target="_blank"><em>新闻</em></a></td>
    </tr>
   <tr class="own stripe">
       <td class="first"> <a href="http://www.sina.com" target="_blank"><em>新浪</em></a> </td>
       <td class="second"><a href="http://news.sina.com" target="_blank"><em>新闻</em></a></td>
    </tr>
</table

1. 需要在html中的众多table中, 找到这个class="table-list"的table
2. 提取这个table中的文本及文本对应的连接, 如:
   百度: http://www.baidu.com
   新闻: http://news.baidu.com

解决思路就是, 先使用handle_data提取这个table中的文本, 然后设置一个标志, 再使用start_a提取href, 在start_a中判断之前的标志是否为真, 如果是真, 即可提取.

论坛徽章:
0
4
发表于 2011-07-26 14:18
NND, 气愤的解决问题了, 再帖出来, 看看我们的铁道部是否还会重现!

html中的一个table:

<table class="table-list" cellpadding="0" cellspacing="0" border="0">
   <tr class="own">
       <td class="first"> <a href="xxx.xxx.com" target="_blank"><em>百度</em></a> </td>
       <td class="second"><a href="xxx.xxx.com" target="_blank"><em>新闻</em></a></td>
    </tr>
   <tr class="own stripe">
       <td class="first"> <a href="xxx.xxx.com" target="_blank"><em>新浪</em></a> </td>
       <td class="second"><a href="xxx.xxx.com" target="_blank"><em>新闻</em></a></td>
    </tr>
</table

1. 需要在html中的众多table中, 找到这个class="table-list"的table
2. 提取这个table中的文本及文本对应的连接, 如:
   百度: xxx.xxx.com
   新闻: xxx.xxx.com

解决思路就是, 先使用handle_data提取这个table中的文本, 然后设置一个标志, 再使用start_a提取href, 在start_a中判断之前的标志是否为真, 如果是真, 即可提取.

论坛徽章:
0
5
发表于 2011-07-26 14:33
NND, 气愤的解决问题了, 再帖出来, 看看我们的铁道部是否还会重现!

html中的一个table:

<table class="table-list" cellpadding="0" cellspacing="0" border="0">
   <tr class="own">
       <td class="first"> <a href="xxx.xxx.xxx" target="_blank"><em>百度</em></a> </td>
       <td class="second"><a href="xxx.xxx.xxx" target="_blank"><em>新闻</em></a></td>
    </tr>
   <tr class="own stripe">
       <td class="first"> <a href="xxx.xxx.xxx" target="_blank"><em>新浪</em></a> </td>
       <td class="second"><a href="xxx.xxx.xxx" target="_blank"><em>新闻</em></a></td>
    </tr>
</table

1. 需要在html中的众多table中, 找到这个class="table-list"的table
2. 提取这个table中的文本及文本对应的连接, 如:
   百度: xxx.xxx.xxx
   新闻: xxx.xxx.xxx

解决思路就是, 先使用handle_data提取这个table中的文本, 然后设置一个标志, 再使用start_a提取href, 在start_a中判断之前的标志是否为真, 如果是真, 即可提取.

论坛徽章:
0
6
发表于 2011-07-26 14:38
NND, 气愤的解决问题了, 再帖出来, 看看我们的铁道部是否还会重现!

html中的一个table:

<table class="table-list" cellpadding="0" cellspacing="0" border="0">
   <tr class="own">
       <td class="first"> <a href="xxx.xxx.xxx" target="_blank"><em>百度</em></a> </td>
       <td class="second"><a href="xxx.xxx.xxx" target="_blank"><em>新闻</em></a></td>
    </tr>
   <tr class="own stripe">
       <td class="first"> <a href="xxx.xxx.xxx" target="_blank"><em>新浪</em></a> </td>
       <td class="second"><a href="xxx.xxx.xxx" target="_blank"><em>新闻</em></a></td>
    </tr>
</table

1. 需要在html中的众多table中, 找到这个class="table-list"的table
2. 提取这个table中的文本及文本对应的连接, 如:
   百度: xxx.xxx.xxx
   新闻: xxx.xxx.xxx

解决思路就是, 先使用handle_data提取这个table中的文本, 然后设置一个标志, 再使用start_a提取href, 在start_a中判断之前的标志是否为真, 如果是真, 即可提取.

论坛徽章:
0
7 [报告]
发表于 2011-07-26 14:40 |只看该作者

论坛徽章:
0
8 [报告]
发表于 2011-07-26 16:58 |只看该作者
前些天在perl版看到同样问题。貌似是总管理员他们在后台调试,自动删帖哈。。。看看大老板会不会出来澄清

论坛徽章:
0
9 [报告]
发表于 2011-07-26 17:11 |只看该作者
用的ubuntu os?

论坛徽章:
0
10 [报告]
发表于 2011-07-26 17:16 |只看该作者
suse嘛,  左下脚那个明显的 蜥蜴 logo....
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP