package demo.analysis; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.io.InputStreamReader; import java.io.Reader; import java.io.StringReader; import java.io.UnsupportedEncodingException; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import jeasy.analysis...
by odin2008 - Java文档中心 - 2008-05-29 10:58:24 阅读(3707) 回复(0)
bobo-browse为lucene添加分组统计 Bobo-browse是一个基于lucene的搜索结果分组统计开源插件,可以完成对搜索结果的分组面统计,比如在淘宝上搜索“衬衣”,在搜索结果顶上显示 “长袖衬衫(10321) 短袖衬衫(32561) ”等。 虽然lucene 在3.2.0也提供了Grouping组件来提供分组统计功能,另作讨论,这里不做讨论。 据Bobo-browse项目介绍, Linkedin.com使用了该组件。 Bobo-browse仅关注搜索,对索引创建与...
利用bobo-browse 实现lucene的分组统计功能 bobo-browse 是一用java写的lucene扩展组件,通过它可以很方便在lucene上实现分组统计功能。 可以从 http://code.google.com/p/bobo-browse/ 上下载和查看相关文档。 下面介绍如何使用: 第一步:设置相关配置文件 bobo-browse 使用了spring,这里主要配置bobo.spring和field.xml两个文件。可以从他的源码例子中找到这两个文件,参考它做相应的修改。[code]bobo.spring
[code]package com.lucene.search; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.document.Field.Index; import org.apache.lucene.document.Field.Store; import org.apache.lucene.document.Field.TermVector; imp...
先到 http://www.apache.org/dist/lucene/java/ 下载 luce-2.3.2.zip 找到lucene-core-2.3.2.jar,lucene-demos-2.3.2.jar加到Class_path中 就可以使用 下面是具体的使用: ---建立索引目录 package cn.jane.main; import java.io.File; import java.io.FileReader; import java.io.Reader; import java.util.Date; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; imp...
lucene 2.0以后API接口发生了不少的变化。其中比较重要的是Field。 Field没了Keyword、UnIndexed、UnStored、Text这几个静态成员,只能用 Field(String, String, Store, Index)构造函数生成实例 Field类一共有5种构造函数: , org.apache.lucene.document.Field.Store)]Field ( String name, byte[] value, Field.Store store) Create a stored field with binary value. Field ( String name, Reader read...
下边为StandardTokenizer.jj的代码,省略了前面的注释!使用Javacc的语法写成的,学过javacc的语法之后,在看这些代码就 比较容易了,而且整个Standard包下其他很多代码都是由此文件生成的.根据此文件可以看StandardTokenizer用来实现区分 token,从而StandardAnalyzer使用的分词方法就是单字切分. 下边为StandardTokenizer.jj的代码,省略了前面的注释!使用Javacc的语法写成的,学过javacc的语法之后,在看这些 代码就比较容易了,而且整个S...
学习lucene,感觉lucene确实是个好东东! 重要的网址 http://lucene.apache.org/ lucene2.0.0 本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u/22660/showart_152586.html
因为工作的缘故,所以需要找一个能进行全文索引查询的工具。本来公司买了龙卷风的产品,这是另外一个同事的工作。我挺感兴趣的,在网上就找类似的资料熟悉一下,结果发现了lucene这个免费的开发包,然后就下了1.4版的。 为了尽快熟悉,所以做了几个小例子。 /** *目的:测试lucene的Index接口 *日期:2005.02.23 *作者:Yanlw */ import java.io.File; import java.io.Reader; import java.io.InputStre...
原文转自: http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/ 本文首先介绍了lucene的一些基本概念,然后开发了一个应用程序演示了利用lucene建立索引并在该索引上进行搜索的过程。 lucene 简介 lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具...