免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
查看: 1452 | 回复: 0
打印 上一主题 下一主题

俺的nutch搜索引擎出鬼了,各位高手请进 [复制链接]

论坛徽章:
0
跳转到指定楼层
1 [收藏(0)] [报告]
发表于 2006-04-18 13:47 |只看该作者 |倒序浏览
本人的nutch的环境调试遇到了很多难题,各位大侠请看看。
之前nutch的安装一直不成功,出现的错误如下
run java in /usr/Java/jdk
060319 220333 parsing file:/usr/local/nutch/conf/nutch-default.xml
060319 220333 parsing file:/usr/local/nutch/conf/crawl-tool.xml
060319 220333 parsing file:/usr/local/nutch/conf/nutch-site.xml
060319 220333 No FS indicated, using default:local
060319 220333 crawl started in: crawl.demo
060319 220333 rootUrlFile = 4
060319 220333 threads = 10
060319 220333 depth = 2
060319 220334 Created webdb at LocalFS,/usr/local/nutch/crawl.demo/db
Exception in thread "main" java.io.FileNotFoundException: 4 (No such file or directory)
        at java.io.FileInputStream.open(Native Method)
        at java.io.FileInputStream.<init>(FileInputStream.java:106)
        at java.io.FileReader.<init>(FileReader.java:55)
        at org.apache.nutch.db.WebDBInjector.injectURLFile(WebDBInjector.java:372)
        at org.apache.nutch.db.WebDBInjector.main(WebDBInjector.java:535)
        at org.apache.nutch.tools.CrawlTool.main(CrawlTool.java:134)
前几天忽然想起了一个问题,因为我的nutch是用root的身份运行的,可能问题就出在此,然后新建了一个其他的用户,安装,运行,nutch成功地执行了内网爬行任务,并且创建了索引。
但是在次开机时再次用nutch抓网页的时候之前的问题又出现了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP