免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 3040 | 回复: 2
打印 上一主题 下一主题

百度zhidao答贴外挂 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-08-01 11:08 |只看该作者 |倒序浏览
百度zhidao答贴外挂

zhuaqu_node.pl
抓取分类模块

zhuaqu_tiezi.pl
抓取帖子和答案(仅在百度中搜索答案)

*.php的文件主要是作为操作界面,很简单。

运行*.pl前请安装mysql4.X版本,安装后请修改mysql密码使得和
程序中root密码一致(当然你也可以用有相同权限的帐号以及密码)

安装mysql后运行baidu.sql中的sqlscript.

perl,并安装DBI,LWP模块,使perl能够访问mysql中的数据和抓取网页。

---------------------------------------------------------------------------------
运行 zhuaqu_node.pl(抓取分类模块)
运行 zhuaqu_tiezi.pl(抓取分类下的帖子和答案)
在你的支持php的服务器下面访问baidu/index.php如http://localhost/baidu/index.php

你就可以答题了
---------------------------------------------------------------------------------

另外在anwser.php的广告部分加入广告内容就可以携带广告发送答案

---------------------------------------------------------------------------------

本程序只是因为我的个人爱好创作,请勿违法。。。

如有任何问题请联系:lzthead@tom.com

目前bug就是没有使用HTML:arser模块对答案进行去html解析,但是在php做的界面里面使用了strip_tags解析

所以有时会出现mysql插入错误。但是很少,速度也比较快

[ 本帖最后由 t6760915 于 2006-8-1 13:55 编辑 ]

baidu.rar

7.16 KB, 下载次数: 107

论坛徽章:
0
2 [报告]
发表于 2006-08-04 23:28 |只看该作者

升级

最新版本,支持从爱问抓取答案,同时匿名回答问题,作了百科回答的界面,对于从yahoo知识堂抓取答案这个严重的问题,呵呵,我不知道怎么进行url编码,所以没法抓取,原谅啊。

配置好环境后你可以开多个帐号同时答题,我用的myie一个myie进程开一个。

主要原理就是抓取模块用perl做,抓取到数据库后用php读取,制作表单,然后post到百度的网关

另外,抓取模块可以不和回答模块运行在同一主机上。

http://perlchina.sun126.com/cgi- ... 1111102&page=15

论坛徽章:
0
3 [报告]
发表于 2006-08-07 17:50 |只看该作者
有些意思,顶了......
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP