深圳SEO公司
欢迎您光临浏览!

搜索引擎的全文检索系统

全文检索( full-text retrieval)技术的出现是信息检索领域的一场革命,它细化了信息检索的粒度。提供了实现多角度,多侧面且全新的信息检索体验。因此搜索引擎全面采用了这种崭新的技术,并使之成为主流的检索方法。

全文检索
早期的信息检索主要通过检索数据信息的外部特征,例如标题、作者、摘要、附录及资料的编号等。这样的检索系统常见于图书馆的馆藏图书检索中,它主要存在如下两个大问题。
1.检索结果排序不理想
2.只能对标题进行检索
出现这些问题是因为没有考虑到文档内容“本章使用文档笼统地代表书籍或者网页)。全文检索顾名思义,是对文档的全部信息进行检索,这些信息包括标题和正文等。简单地说,全文检索的内在本质归纳起来就是如下两条。
1.文档的全部文字参与索引
2.检索结果能够提供检索词出现的实际位置

在全文检索的过程中,只需要用户提供一个或多个检索关健词(以下筒称“关健词”)。不仅能够检索出命中的文本,还能够提供这些关键词在文本中出现的位置。受到搜索引擎检索结果的展示窗口的限制,不可能把全部关键词出现的位置一一列出。最终的展示效果如图5-1所示。

搜索引擎检索结果

其中椭圆矩形表示网民向搜索引擎提交的关键字,矩形框表示关镇字在文档中的位置。这里搜索引擎采用一种称为“标红”的技术用红色标出关健词,其余文字为黑体,这样的方法比用数字标出位置信息更加直观。接下来用户就可以通过上下文、关键词在文本中的位置,以及检索到的文档标题等因素确定哪一条才是符合需要的检索结果。例如图5-1是用“全文检索”这个关键字在Google搜索引擎中进行检索的结果。
当今搜索引擎无一例外地采用了全文检索,使得越来越多的人开始使用搜索引擎查找信息,信息检索的面貌也为之一新。在这革命性的搜索体脸背后蕴涵的是大量的信息组织的智做慧,它最终使得全文检索从梦想成为现实。

本文出自深圳SEO公司,未经允许不得转载:深圳SEO-微笑SEO服务公司 » 搜索引擎的全文检索系统
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址