深圳SEO
欢迎您光临!

搜索引擎的分析系统-知识准备

第一节知识准备
搜索引擎的4大系统中的第2个系统是分析系统,分析系统主要完成的工作包括信息抽取、网页消重、中文分词和Page Rank计算等。接下来的各节将按照这个顺序层层深入地介绍分析系统的工作。在此之前了解一些基本概念。

HTML语盲
HTML语言(Hyper Text Markup Language,超文本标记语言)是一种专门的编程语言)用于创建存储在www服务器上的文件,并能由Netscape及Microsoft Explorer等浏览盼浏览。由于HTML语言简单易用,不需要编译的特性,因此被广泛地使用。

锚文本(anchor text)
锚文本网页中关于链接的一段描述,通常以文本和图片的方式出现.可以指向文中的某个位置,也可以指向其他网页。例如HTML脚本深圳SEO中的“深圳SEO”就是一个“锚文本”,它用来描述其指向的链接。

半结构化徽据(Semi-structured data)
和普通纯文本相比,万维网上的网页数据具有一定的结构性,但是这种HTML标签带来的结构性不能满足网页结构化的需要。例如标签标识网页主题.而

标签有些表示文章主题.有些表示文章段落,或者其他广告信息等。因此人们称网页的原始数据为“半结构化数据”,这是HTML语言的基本特点。

本文出自深圳SEO公司,未经允许不得转载:深圳SEO公司-深圳SEO服务公司 » 搜索引擎的分析系统-知识准备
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址