深圳SEO公司
欢迎您光临浏览!

用户对搜索引擎的主要需求

随着万维网信息爆炸性地飞速增长,传统的查询方法无法为网民提供有效的服务。万维网的发展迫切地要求一种快速、全面、准确且稳定可靠的信息查询方法,由于搜索引擎满足了这4个需求,所以才奠定了其在科学技术上的高度。有人甚至把搜索引擎和操作系统并列为当今最为复杂的系统软件,下面我们将对搜索引擎中最为主要的4个需求,同样也是搜索引擎的主要特点加以说明。
1.查得快 一方面。随着信息化社会的到来。信息可以说是无处不在,人们的日常生活离不开这些有价值的信息;另一方面,人们的生活节奏也在不断地加快,人们应该能够平等地获得这些公众信息。这就要求搜索引擎必须能够存储这些无处不在的信息并且能够快速地进行信息查询,满足网民的查询需求。有调查表明,当今公开的搜索引擎的查询速度都在秒这个量级以下,商用搜索引擎的查询速度达到毫秒级,并且能够支持大规模用户的同时访问。 影响速度的原因很多,例如索引库的效率、分布查询的处理能力和查询缓存的命中率等,这些将在第四章和第五章中详细介绍。

2.查得全 在传统信息检索( information retrieval)中。应用查全率(Recall)作为衡量检索是否全面的度量指标(本章不区分查询和检索的区别)查全率是检索出的相关网页数和所有的相关网页数的比率。例如在搜索引擎中查询“XML”。如果世界上包含“XML”这个关键词的网页数为M,而实际该搜索引擎检索出这M条中的N条网页,那么查全率为N/M x 100%。 是否能查得全。主要取决于网页索引库的大小。从这一点上讲,索引的网页数越多。越有助于提高查全率。

3.查得准 在传统信息检索中,应用查准率(Precision)作为衡量检索是否准确的指标,查准率是检索出的相关文档数与检索出的文档总数的比率。例如在搜索引擎中直询“XML”,在实际检索出的网页数N中,只有P个网页是与查询“XML”相关的,那么查准率为P/N x 100%。
通过图2-1,可以全面理解查全率和查准率的关系。

 

 

 

 

 

查全率=

 

 

 

,其中对集合取丨丨运算的结果表示无依集合数量。
查准率=


 

在搜索引擎这种特殊的检索实践中,查全率往往是不重要的。衡量的意义也不大,因为没有一个用户会把所有与查询相关的网页都浏览一遍。一般情况下,用户最为关注的仅仅为搜索结果中的前几条。而查准率在很大程度上决定了搜索的质量,在前10条搜索结果(搜索结果首页)中满足用户的查询目的是搜索引擎查准率的主要体现。 是否能查得准,主贾取决于网页排序。常见的有PageRank等排序方法。在第四章中将介绍这方面的内容。

4.查得稳 毫无疑问,搜索引擎必须是一个能够长期并稳定地提供服务的系统,因此系统的稳定运行是很重要的需求。特别是商用搜索引擎,其稳定性被提高到了相当的高度。在任何情况下可以牺牲检索质量和检索速度,但必须能够提供持续的信息检索服务。 对于搜索引擎来说,查询来自四面八方。查询词也千差万别,同时进行的查询量也非常巨大。稳定地满足这些查询需要,需要在系统的结构上做出权衡。在文件存储方式、查询系统和索引系统设计等方面都需要考虑稳定性的因素。

本文出自深圳SEO公司,未经允许不得转载:深圳SEO-微笑SEO服务公司 » 用户对搜索引擎的主要需求
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址