ChinaUnix.net
相关文章推荐:

nutch搜索摘要前的”

搜索引擎nutch在查询搜索结果时,只有下一页功能。现在实现了分页功能,并把是show all hits删去 1.删去show all hits 修改: int hitsPerSite = 0; // max hits per site 2.分页功能 = hitsPerPage) // more hits to show { %> "> "> ...

by java_mail - Java文档中心 - 2007-10-06 02:38:34 阅读(1094) 回复(0)

相关讨论

nutch搜索技术相关的资料.oO ┌───────────────────────── │nutch相关的资料 - 中文处理 (05年06月17日开始收集) └───────────────────────── http://issues.apache.org/jira/browse/nutch-36 http://www.mail-archive.com/nutch-developers@lists.sourceforge.net/msg03907.html 以上两个链接的内容出处相同,都是Apache nutch dev mail archive。 由Jack Tang于04-Ap...

by softiger - Java文档中心 - 2007-04-16 16:14:25 阅读(788) 回复(0)

下载: 可以去Apache的官方网页 [color="#800080"]http://www.apache.org/dyn/closer.cgi/lucene/nutch/ 下载最新版的nutch,目最新版是nutch-0.9,65M大小。 解压缩进入bin/就能用 [color="#000000"]安装辅助软件(运行环境): nutch是用java写的一个开源项目,所以要使它正常运行必须安装JDK(也为了能修改nutch),Java 1.4.x以上版本,设置环境变量nutch_JAVA_HOME为java虚拟机的...

by odin2008 - Java文档中心 - 2008-07-23 16:09:40 阅读(2447) 回复(0)

下载: 可以去Apache的官方网页 http://www.apache.org/dyn/closer.cgi/lucene/nutch/ 下载最新版的nutch,目最新版是nutch-0.9,65M大小。 解压缩进入bin/就能用 安装辅助软件(运行环境): nutch是用java写的一个开源项目,所以要使它正常运行必须安装JDK(也为了能修改nutch),Java 1.4.x以上版本,设置环境变量nutch_JAVA_HOME为java虚拟机的安装目录。 此外,还必须安装Apache's Tomcat 4.x 以上版本。 最后,想得到较...

by java_mail - Java文档中心 - 2007-10-22 16:54:22 阅读(896) 回复(0)

nutch搜索引擎之分布式文件系统 NDFS:在一系列机器上存储庞大的面向流的文件,包含多机的存储冗余和负载均衡。 文件以块为单位存储在NDFS的离散机器上,提供一个传统的input/output流接口用于文件读写。 块的查找以及数据在网络上传输等细节由NDFS自动完成,对用户是透明的。而且NDFS能很好地处理 用于存储的机器序列,能方便地添加和删除一台机器。当某台机器不可用时,NDFS自动的保证文件 的可用性。只要网上的机器序列能提...

by softiger - Java文档中心 - 2007-04-16 10:20:03 阅读(781) 回复(0)

本人的nutch的环境调试遇到了很多难题,各位大侠请看看。 之nutch的安装一直不成功,出现的错误如下 run java in /usr/Java/jdk 060319 220333 parsing file:/usr/local/nutch/conf/nutch-default.xml 060319 220333 parsing file:/usr/local/nutch/conf/crawl-tool.xml 060319 220333 parsing file:/usr/local/nutch/conf/nutch-site.xml 060319 220333 No FS indicated, using default:local 060319 220333 crawl started in: c...

by LinuxWalker - 服务器架设 - 2006-04-18 13:47:25 阅读(1220) 回复(0)

关键词: nutch, 框架图 本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/6889/showart_1000540.html

by lc0060305 - 网络技术文档中心 - 2008-06-13 16:08:32 阅读(789) 回复(0)

nutch作为一款刚刚诞生的开源Web搜索引擎,提供了除商业搜索引擎外的一种新的选择。个人、企业都可通过nutch来构建适合于自身需要的搜索引擎平台,提供适合于自身的搜索服务,而不必完全被动接收商业搜索引擎的各种约束。 nutch的工作流程可以分为两个大的部分:抓取部分与搜索部分。抓取程序抓取页面并把抓取回来的数据进行反向索引,搜索程序则对反向索引进行搜索回答用户的请求,索引是联系这两者的纽带。图1是对nutch整个工作...

by xpjjy - Java文档中心 - 2009-01-09 16:16:22 阅读(1198) 回复(0)

nutch配置笔记 相关环境 1、Java jdk1.5.0_08 http://java.sun.com/javase/downloads/index.jsp 安装目录:C:\Program Files\Java\jdk1.5.0_08 2、Apache’s Tomcat 5.5 http://tomcat.apache.org/download-55.cgi 安装目录:C:\Program Files\Apache Software Foundation\Tomcat 5.5 3、OS:Win xp, Cygwin,for shell support (Windows 下需要Linux 模拟器) http://www.cygwin.com/ 安装目录:C:\cygwin 5、nutch-0....

by softiger - Java文档中心 - 2006-12-05 15:35:14 阅读(767) 回复(0)

在RH9+J2EE5.0+TOMCAT5.0.28,使用nutch-0.6完成了企业内部网简单测试,并记录遇到的问题和解决方法 今天的天气真是热死了!没办法,呆在家里吧,有空调凉快些。于是想到了研究nutch 这是一个开源的搜索引擎,现在已经列入Apache的Lucene的子项目了。最新版本是0.6(2005年1月)。以我安装过,没有成功。这次终于成功了,做了简单测试 参考文章来源: nutch文档 作者Fenng: http://www.dbanotes.net/archives/2005/01/nutch_ae...

by softiger - Java文档中心 - 2006-12-05 10:59:18 阅读(550) 回复(0)