深圳SEO公司
欢迎您光临浏览!

搜索引擎采用的检索模型

搜索引擎采用了布尔模型和向量空间模型结合的方法来进行信息检索,布尔模型的检索效率高且易于实现;向量空间模型能够提高检索的相似度,通过相似度排序的手段能够大大改善查询效果。因此搜索引擎将二者的优势相结合,完整的检索过程如图6-3所示。

搜索引擎将二者的优势相结合完整的检索过程

如图6-3所示,图中方块为计算部分,斜方块为数据部分,详细的检索过程如下。

1.对查询词进行分词,得到一个逻辑表达式。例如查询“走进搜索引擎”,将会被切分成“走进”,“搜索引擎”这两个词。并且转换为用AND逻辑表示的表达式,即“走进”AND“搜索引擎”。
2.采用布尔模型的方法得到结果文档列表,例如从倒排索引中提取包含“走进”关键词文档列表和包含“搜索引擎”关键词的文档列表。并将检索出的文档列表求交集,得到既包含“走进”,也包含“搜索引擎”的文档列表。
3.将步骤(2)得到的文档列表中的全部文档和查询词分别向量化,并求向量间的相似度。
4.按照相似度排序输出检索结果。
综上所述,全部过程包括分词、doclist求交、向量化并求向量夹角及排序这4种计算,并且这4项计算依次完成。在查询系统我们介绍过分词的计算,这里不再重复,接下来的两个小节将依次介绍文档列表求交的计算方法和结果排序的技巧。

本文出自深圳SEO公司,未经允许不得转载:深圳SEO公司-深圳SEO服务公司 » 搜索引擎采用的检索模型
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址