Lucene词频统计

基于lucene的java词频统计

package demo.analysis; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.io.InputStreamReader; import java.io.Reader; import java.io.StringReader; import java.io.UnsupportedEncodingException; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import jeasy.analysis...

by odin2008 - Java文档中心 - 2008-05-29 10:58:24 阅读（3707）回复（0）

其他文章推荐

QQ空间新浪微博腾讯微博人人网开心网豆瓣网百度空间更多

bobo-browse为lucene添加分组统计　

bobo-browse为lucene添加分组统计　　Bobo-browse是一个基于lucene的搜索结果分组统计开源插件，可以完成对搜索结果的分组面统计，比如在淘宝上搜索“衬衣”，在搜索结果顶上显示 “长袖衬衫（10321）短袖衬衫（32561） ”等。虽然lucene 在3.2.0也提供了Grouping组件来提供分组统计功能，另作讨论，这里不做讨论。据Bobo-browse项目介绍, Linkedin.com使用了该组件。 Bobo-browse仅关注搜索，对索引创建与...

java

by cu_Cbear - Java - 2011-11-16 18:10:44 阅读（1592）回复（0）

利用bobo-browse 实现lucene的分组统计功能

利用bobo-browse 实现lucene的分组统计功能 bobo-browse 是一用java写的lucene扩展组件，通过它可以很方便在lucene上实现分组统计功能。可以从 http://code.google.com/p/bobo-browse/ 上下载和查看相关文档。下面介绍如何使用：第一步：设置相关配置文件 bobo-browse 使用了spring，这里主要配置bobo.spring和field.xml两个文件。可以从他的源码例子中找到这两个文件，参考它做相应的修改。[code]bobo.spring

java

by 听老歌 - Java - 2011-11-15 15:37:40 阅读（1906）回复（0）

lucene

[code]package com.lucene.search; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.document.Field.Index; import org.apache.lucene.document.Field.Store; import org.apache.lucene.document.Field.TermVector; imp...

java lucene

by longmm1988 - Java - 2011-09-06 10:02:26 阅读（1378）回复（0）

lucene入门

先到 http://www.apache.org/dist/lucene/java/ 下载 luce-2.3.2.zip 找到lucene-core-2.3.2.jar,lucene-demos-2.3.2.jar加到Class_path中就可以使用下面是具体的使用: ---建立索引目录 package cn.jane.main; import java.io.File; import java.io.FileReader; import java.io.Reader; import java.util.Date; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; imp...

by itanger - Java文档中心 - 2008-07-01 17:53:36 阅读（1032）回复（0）

lucene Field

lucene 2.0以后API接口发生了不少的变化。其中比较重要的是Field。 Field没了Keyword、UnIndexed、UnStored、Text这几个静态成员，只能用 Field(String, String, Store, Index)构造函数生成实例 Field类一共有5种构造函数： , org.apache.lucene.document.Field.Store)]Field ( String name, byte[] value, Field.Store store) Create a stored field with binary value. Field ( String name, Reader read...

by linxh - Java文档中心 - 2008-05-27 11:03:29 阅读（1048）回复（0）

lucene分词

下边为StandardTokenizer.jj的代码,省略了前面的注释!使用Javacc的语法写成的,学过javacc的语法之后,在看这些代码就比较容易了,而且整个Standard包下其他很多代码都是由此文件生成的.根据此文件可以看StandardTokenizer用来实现区分 token,从而StandardAnalyzer使用的分词方法就是单字切分. 下边为StandardTokenizer.jj的代码,省略了前面的注释!使用Javacc的语法写成的,学过javacc的语法之后,在看这些代码就比较容易了,而且整个S...

by zuzhiyang - Java文档中心 - 2007-10-30 15:18:44 阅读（1128）回复（0）

php lucene

有没有介绍修改php原码的地方？我想用php调用lucene，可是似乎没有好的办法，所以，就想在php的源码中添加一些方法，有这方面的资料么？

by kingbeg - PHP - 2007-01-16 11:03:00 阅读（1446）回复（2）

lucene开篇

学习lucene,感觉lucene确实是个好东东！重要的网址 http://lucene.apache.org/ lucene2.0.0 本文来自ChinaUnix博客，如果查看原文请点：http://blog.chinaunix.net/u/22660/showart_152586.html

by bbflyerwww - Java文档中心 - 2006-08-08 14:51:09 阅读（690）回复（0）

lucene学习

因为工作的缘故，所以需要找一个能进行全文索引查询的工具。本来公司买了龙卷风的产品，这是另外一个同事的工作。我挺感兴趣的，在网上就找类似的资料熟悉一下，结果发现了lucene这个免费的开发包，然后就下了1.4版的。为了尽快熟悉，所以做了几个小例子。 /** *目的：测试lucene的Index接口 *日期：2005.02.23 *作者：Yanlw */ import java.io.File; import java.io.Reader; import java.io.InputStre...

by ylw1694 - Java文档中心 - 2005-03-11 13:52:31 阅读（1102）回复（0）

实战 lucene，第 1 部分: 初识 lucene

原文转自： http://www.ibm.com/developerworks/cn/java/j-lo-lucene1/ 本文首先介绍了lucene的一些基本概念，然后开发了一个应用程序演示了利用lucene建立索引并在该索引上进行搜索的过程。 lucene 简介 lucene 是一个基于 Java 的全文信息检索工具包，它不是一个完整的搜索应用程序，而是为你的应用程序提供索引和搜索功能。lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具...

by linxh - Java文档中心 - 2007-09-05 11:13:14 阅读（941）回复（0）

盛拓传媒：

IT168 | 泡泡网 | 汽车之家 | 二手车之家 | 渠道168 | ITPUB | IXPUB | ChinaUnix | 安卓之家 | 苹果园 | 家商城 | 苹果论坛

Lucene词频统计

基于lucene的java词频统计

fileno()

安装了purify之后

图解安装opensolaris,windows xp,ubuntu在一块硬盘上

金山软件招聘题目

Ubuntu vim 问题编辑java高亮问题

hw tcp v4 csum failed

[Android] ramdisk.img的生成及解压

如何捕获400系统产生的message信息

InstallAnywhere 2009 Enterprise build 3783破解

debian 从硬盘安装需要把ISO文件解开吗?