搜索引擎算法之HITS算法

经常会遇到一些小伙伴问,大仙,为什么导航网站的首页能有这么高的权重啊?它明明没有什么真实内容啊,全部都是放一些人家第三方的网站在上面。

 

如果你了解搜索引擎算法中的HITS算法,那么这个问题就迎刃而解。

 

一、HITS算法的概念

“HITS算法是用户输入关键词后,算法会对返回的匹配页面计算两种值,一种是枢纽值(Hub Scores),另一种是权威值(Authority Scores),这两种值是互相依存、互相影响的。”——百度百科

 

这里要注意两点,枢纽值(Hub Scores)和权威值(Authority Scores),它们是构成HITS算法的两个基础定义,也是本文重点解释要解释的,我们简称为:Hub和Authority页面

 

Hub页面:指的是包含了大量的高质量Authority页面链接的网页;

 

Authority页面:指的是与某个领域或者某个话题相关的高质量页面;

 

很抽象是么?直观来讲,网址导航的首页,是一个高质量的Hub页面。

 

而我们所必用的百度首页,就是搜索引擎领域一个高质量的Authority页面。

 

两者关系是互相影响,互相增强的。

 

HITS算法

 

二、HTIS算法和PR算法

我们之前有提到过搜索引擎的目标:更全、更快、更准;HTIS算法则属于“更准”环节。

 

同属于“更准”环节的包括百度超链接算法和谷歌PR算法(这个比较重要,后面我会详细介绍),它们都是一种链接分析算法。

 

不同的是,HITS算法开始于用户查询,而PR算法是全局性的,与查询无关,在分析页面的时候就已经开始启用。

 

三、HITS算法对seo的应用

相信很多做百科的小伙伴,都会遇到一个问题,需要权威网站的相关参考页面,很多人都会因此去购买新闻源发软文。

 

那这个参考页面有啥用?

 

除了考虑到对该词条的信息补充,从本文的HITS算法角度考虑。

 

添加其他权威网站的相关参考页面,有利于帮助该词条的百科页面,成为一个Hub页面;与此同时,因为百科页面本身丰富的内容,它同属于一个高质量的Auhority页面。

 

这就是我们上面有提到的,两者互相影响,互相增强,并非独立关系。

 

所以我们学习到的优化知识点:

 

3.1、高质量参考页面的引用

在编辑文章的时候,特别是想写高质量文章,不要吝啬你的链接,可以适当的引用其他高质量的相关页面,详细请参考百科页面。

 

注:需要说明这点,很多垃圾网页,就喜欢利用这一点作弊;因为上面有提到,一个页面大量给出链接到高质量的页面,它属于Hub页面。

 

而垃圾页面其实质内容可能是些黄赌毒,同时又输出链接到Auhority页面,这会提高页面自身的Hub分值,混淆蜘蛛的判断。

 

3.2、高质量的外链建设

排除那些使用工具或者Python日发百万外链,如果你无法做到这么多;请你相信,多做些高质量的外链,好过花时间去发垃圾链接。

 

高质量的外链平台包括:知乎、豆瓣、简书、行业论坛(博客)等等。

 

3.3、Auhority页面更重要

虽然HITS算法会分析页面的两个分值,然而对于搜索引擎来说,Auhority值更重要。

 

不难理解,毕竟Auhority页面是实实在在的内容输出。(采集站请略过)

 

3.4、不要随意使用nofollow标签

见过一些人总会问,网站的备案链接需不需要添加nofollow标签?

 

看完本文,相信你已经有了答案。

 

参考页面:

百度百科:HITS算法详解;

HITS算法与PageRank算法比较分析;

赞赏

微信赞赏支付宝赞赏

相关文章