ybu2008 发表于 2011-12-20 09:47

传统搜索技术

<span style="font-family: 宋体;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 搜索引擎系统分类</span>

<table class="MsoNormalTable" style="border-collapse: collapse; border: medium none;" border="1" cellpadding="0" cellspacing="0">
<tbody><tr style="">
<td style="width: 213.05pt; border: 1pt solid black; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">搜索引擎技术类别</span></p>
</td>
<td style="width: 213.05pt; border-width: 1pt 1pt 1pt medium; border-style: solid solid solid none; border-color: black black black -moz-use-text-color; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">搜索引擎技术描述</span></p>
</td>
</tr>
<tr style="">
<td style="width: 213.05pt; border-width: medium 1pt 1pt; border-style: none solid solid; border-color: -moz-use-text-color black black; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">目录式搜索引擎</span></p>
</td>
<td style="width: 213.05pt; border-width: medium 1pt 1pt medium; border-style: none solid solid none; border-color: -moz-use-text-color black black -moz-use-text-color; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中,由于</span><span lang="EN-US">web</span><span style="font-family: 宋体;">信息的海量性和人工处理能力、经济代价的限制,这类搜索引擎信息的即时性和全面性难以保证</span></p>
</td>
</tr>
<tr style="">
<td style="width: 213.05pt; border-width: medium 1pt 1pt; border-style: none solid solid; border-color: -moz-use-text-color black black; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">机器人搜索引擎</span></p>
</td>
<td style="width: 213.05pt; border-width: medium 1pt 1pt medium; border-style: none solid solid none; border-color: -moz-use-text-color black black -moz-use-text-color; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">由一个称为蜘蛛的机器人程序以某种策略自动地在因特网中搜集合发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户,这类搜索引擎实现较为复杂,但能很好地实现信息的全面获取和即时性</span></p>
</td>
</tr>
<tr style="">
<td style="width: 213.05pt; border-width: medium 1pt 1pt; border-style: none solid solid; border-color: -moz-use-text-color black black; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">元搜索引擎</span></p>
</td>
<td style="width: 213.05pt; border-width: medium 1pt 1pt medium; border-style: none solid solid none; border-color: -moz-use-text-color black black -moz-use-text-color; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户,这类搜索引擎集合了多个搜索引擎的信息,并且加入新的排序和信息过滤,可以很好地提高用户满意度</span></p>
</td>
</tr>
</tbody></table>

<p class="MsoNormal"><span style="font-family: 宋体;">机器人搜索引擎是目前主流的技术,它的实现包括</span><span lang="EN-US">3</span><span style="font-family: 宋体;">个关键点:利用网络蜘蛛获取网络资源、利用索引器抽取信息并建立索引表和检索及用户交互。</span></p>

<p class="MsoNormal"><span style="font-family: 宋体;">搜索引擎的评价指标主要包括响应时间、查全率、查准率和用户满意度等。</span></p>

<p class="MsoNormal"><span lang="EN-US">&nbsp;</span></p>

<p class="MsoNormal" style="text-align: center;" align="center"><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络搜索技术</span></p>

<table class="MsoNormalTable" style="border-collapse: collapse; border: medium none;" border="1" cellpadding="0" cellspacing="0">
<tbody><tr style="">
<td style="width: 213.05pt; border: 1pt solid black; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">网络类型</span></p>
</td>
<td style="width: 213.05pt; border-width: 1pt 1pt 1pt medium; border-style: solid solid solid none; border-color: black black black -moz-use-text-color; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">技术特点及代表系统</span></p>
</td>
</tr>
<tr style="">
<td style="width: 213.05pt; border-width: medium 1pt 1pt; border-style: none solid solid; border-color: -moz-use-text-color black black; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">集中式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络</span></p>
</td>
<td style="width: 213.05pt; border-width: medium 1pt 1pt medium; border-style: none solid solid none; border-color: -moz-use-text-color black black -moz-use-text-color; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">集中式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络通过一个中心服务器来记录共享信息以及回答对这些信息的查询,每一个对等实体负责共享它的信息,下载它所需要的存储在其它对等实体上的信息。这种信息具有中心化的特点,但它不同传统上的</span><span lang="EN-US">client/server</span><span style="font-family: 宋体;">模式。所有信息都分别存放在提供该信息的客户端上,服务器只保留索引信息,此外服务器与对等实体以及对等实体之间都具有交互能力。这类网络代表系统是</span><span lang="EN-US">Napster</span><span style="font-family: 宋体;">和</span><span lang="EN-US">eMule</span></p>
</td>
</tr>
<tr style="">
<td style="width: 213.05pt; border-width: medium 1pt 1pt; border-style: none solid solid; border-color: -moz-use-text-color black black; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">结构化分布式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络</span></p>
</td>
<td style="width: 213.05pt; border-width: medium 1pt 1pt medium; border-style: none solid solid none; border-color: -moz-use-text-color black black -moz-use-text-color; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">结构化分布式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络是一种纯</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络。这种网络不需要有中心服务器和中心路由器,其上每一个</span><span lang="EN-US">peer</span><span style="font-family: 宋体;">都作为对等实体,地位完全平等的。每一个</span><span lang="EN-US">peer</span><span style="font-family: 宋体;">既可以作为客户端又可以作为服务器,并且它们与相邻的</span><span lang="EN-US">peer</span><span style="font-family: 宋体;">有相同的能力。这类网络中每个</span><span lang="EN-US">peer</span><span style="font-family: 宋体;">被分配一个虚拟地址,同时用一个关键字来表示其可以提供的共享内容。网络中各个节点分别存储自己的虚拟地址路由表进行路由。关键字存储在与关键字匹配的虚拟地址上。资源定位的时候,可以通过虚拟地址路由表快速查询到存储关键字的节点,从而获取共享内容的存储位置。这类网络的代表系统是</span><span lang="EN-US">Chord</span><span style="font-family: 宋体;">、</span><span lang="EN-US">Pastry</span><span style="font-family: 宋体;">、</span><span lang="EN-US">CAN</span><span style="font-family: 宋体;">、</span><span lang="EN-US">Tapestry</span><span style="font-family: 宋体;">、</span><span lang="EN-US">Kademlia</span></p>
</td>
</tr>
<tr style="">
<td style="width: 213.05pt; border-width: medium 1pt 1pt; border-style: none solid solid; border-color: -moz-use-text-color black black; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">非结构化分布式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络</span></p>
</td>
<td style="width: 213.05pt; border-width: medium 1pt 1pt medium; border-style: none solid solid none; border-color: -moz-use-text-color black black -moz-use-text-color; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">非结构化分布式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络和结构话分布式</span><span lang="EN-US">p2p</span><span style="font-family: 宋体;">网络一样,也是一种纯</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络,只是在网络拓扑结构上有所不同。这类网络中每个节点都拥有自己的邻居(</span><span lang="EN-US">peer-group</span><span style="font-family: 宋体;">)。查询文件时,节点向自己的所有邻居发送查询数据包。每一个收到查询数据包的节点将检查在自己本地存储的文件是否满足查询要求。如果满足的话,该节点发送一个查询响应数据包给查询的初始发起者,节点间直接交换文件。不管满足与否,该用户都继续将查询数据包向自己的邻居节点转发。以此类推,查询消息像洪水(</span><span lang="EN-US">Flood</span><span style="font-family: 宋体;">)一样在网络中流动。这类网络的代表系统是</span><span lang="EN-US">Gnutella</span></p>
</td>
</tr>
<tr style="">
<td style="width: 213.05pt; border-width: medium 1pt 1pt; border-style: none solid solid; border-color: -moz-use-text-color black black; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">混合式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络</span></p>
</td>
<td style="width: 213.05pt; border-width: medium 1pt 1pt medium; border-style: none solid solid none; border-color: -moz-use-text-color black black -moz-use-text-color; padding: 0cm 5.4pt;" valign="top" width="284">
<p class="MsoNormal"><span style="font-family: 宋体;">混合式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络是集中式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络和分布式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络的集合。集中式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络有利于网络资源的快速检索。以及只要服务器能力足够强大就可以无限扩展,但是其中心化的模式容易遭到直接的攻击;分布式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络具有良好的抗击性,但是又缺乏快速搜索的能力和扩展性。混合式</span><span lang="EN-US">P2P</span><span style="font-family: 宋体;">网络在分布式网络的基础上,将节点按能力进行分类,使某些节点担任特殊的任务,称之为超级节点,超级节点分担了网络大部分的检索、路由和扩展功能,使普通节点的负载下降。这类网络的代表系统是</span><span lang="EN-US">Skype</span></p>
</td>
</tr>
</tbody></table>

<p class="MsoNormal"><span lang="EN-US">&nbsp;参考:</span><span style="font-family: 宋体;">《</span><font size="-1"><em>P2P</em>网络技术原理与<em>C++</em>开发<em>案例》</em></font></p>
页: [1]
查看完整版本: 传统搜索技术