免费注册 查看新帖 |

Chinaunix

  平台 论坛 博客 文库
最近访问板块 发新帖
楼主: mygod

有没有人想过开发一个对非结构化信息的全文检索引擎 [复制链接]

论坛徽章:
0
发表于 2003-08-26 12:46 |显示全部楼层

有没有人想过开发一个对非结构化信息的全文检索引擎

置顶了
一起好好讨论吧

UML是我的错 没有时间整理 并且手头资料也不多

要分析的数据是不是跟google差不多

也就是在浏览器上查询而不是使用专门的软件

还有要分析的数据类型是不是那么多 也就是分散的文档资料

还有要做成几层的 B/S不是很熟悉 我不知道B/S中要做成三层的话除了那些中间件外还有没有其它的实现方法

开发语言可以先不考虑吧
到最后实现时再考虑

论坛徽章:
0
发表于 2003-08-26 12:53 |显示全部楼层

有没有人想过开发一个对非结构化信息的全文检索引擎

和google完全不一样的,google我不太了解实现机制,但是至少应用的领域就不一样,google应当是搜索网页的,是一个网络搜索引擎,我们这个不是要搜索网页,是对我们自己的非结构化数据库进行检索。

首先我们应当进行需求信息的收集,所以大家都尽可以根据自己的项目经验大胆的提出需求,我们把这些需求收集起来,然后再来分析,那些可以作,那些暂时作不了。

论坛徽章:
0
发表于 2003-08-26 13:00 |显示全部楼层

有没有人想过开发一个对非结构化信息的全文检索引擎

还有开发语言,我觉得也应当作为需求,我建议使用java是因为j2ee已经是最流行的企业级应用的平台和标准了,使用java开发可以比较容易的把这个东西应用于j2ee,无双你考虑到效率建议使用C++,但是我觉得C++没有什么framework,作好了之后用不起来

论坛徽章:
0
发表于 2003-08-26 13:02 |显示全部楼层

有没有人想过开发一个对非结构化信息的全文检索引擎

开始讨论需求吧。

除了最基本的需求:检索各种类型的文件以及关系型数据库

还有什么?

多语言支持?

论坛徽章:
0
发表于 2003-08-26 13:05 |显示全部楼层

有没有人想过开发一个对非结构化信息的全文检索引擎

语言现在先不考虑吧
我以前看到的软件工程都是最后详细设计时才开始考虑语言的

我们先放在一边

多语言觉得现在没有必要做
当然可以保留做以后的接口

我的意思就是现在就先做像你那样的需求
但是模型是B/S还是C/S或是其它或是客户端独立 可以有多个客户端(使用三层做法)
这要定下来吧 客户的使用方式不一样

最后就是性能方面
需要达到多少性能 性能要求不同会影响软件结构的实现

论坛徽章:
0
发表于 2003-08-26 13:07 |显示全部楼层

有没有人想过开发一个对非结构化信息的全文检索引擎

我们要做的其实可以看作一个中间件,应用于B/S还是C/S都可以的

论坛徽章:
0
发表于 2003-08-26 13:08 |显示全部楼层

有没有人想过开发一个对非结构化信息的全文检索引擎

作为一个中间件应当提供运行环境和开发环境

论坛徽章:
0
发表于 2003-08-26 13:11 |显示全部楼层

有没有人想过开发一个对非结构化信息的全文检索引擎

作为运行环境,这个组件(注意我是说组件,并没有说它是一个系统,中间件不能作为一个系统看待)应当可以建立一个查询库(把非结构化的信息放到这个库里面便于检索)

作为开发环境,应当提供一些应用程序可以使用的接口(比如提供EJB)

论坛徽章:
0
发表于 2003-08-26 13:15 |显示全部楼层

有没有人想过开发一个对非结构化信息的全文检索引擎

至于语言,还是应当作为需求的一部分,因为这个和开发一个“系统”不一样,开发一个系统你可以选用任何平台,只要实现功能就可以,但是我们的不是一个系统,所以我们需要决定把它纳入哪个framework,是j2ee还是.net还是其他。。。。

论坛徽章:
0
发表于 2003-08-27 08:30 |显示全部楼层

有没有人想过开发一个对非结构化信息的全文检索引擎

没有人感兴趣?

那斑竹摘了吧,偶只好自己开发了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则 发表回复

  

北京盛拓优讯信息技术有限公司. 版权所有 京ICP备16024965号-6 北京市公安局海淀分局网监中心备案编号:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年举报专区
中国互联网协会会员  联系我们:huangweiwei@itpub.net
感谢所有关心和支持过ChinaUnix的朋友们 转载本站内容请注明原作者名及出处

清除 Cookies - ChinaUnix - Archiver - WAP - TOP