pagerank是Google排名运算法则(排名公式)的一部分,是Google用于用来标识网页的等级/重要性的一种方法,是Google用来衡量一个网站的好坏的唯一标准。在揉合了诸如Title标识和Keywords标识等所有其它因素之后,Google通过PageRank来调整结果,使那些更具“等级/重要性”的网页在搜索结果中令网站排名获得提升,从而提高搜索结果的相关性和质量。
pagerank_pagerank -简介
pagerankPageRank,简称为PR值,又称网页级别、Google左侧排名或佩奇排名。Pagerank取自Google的创始人LarryPage,它是Google排名运算法则的一部分,Pagerank是Google对网页重要性的评估,是Google用来衡量一个网站的好坏的唯一标准。Google通过PageRank来调整结果,使那些更具“重要性”的网页在搜索结果中另网站排名获得提升,从而提高搜索结果的相关性和质量。PR值的级别从1到10级,10级为满分。PR值越高说明该网页越受欢迎。
pagerank_pagerank -概念原理
PageRank是Google算法的重要内容。2001年9月被授予美国专利,专利人是Google创始人之一拉里?佩奇(LarryPage)。因此,PageRank里的page不是指网页,而是指佩奇,即这个等级方法是以佩奇来命名的。但是后来人们还是习惯将PageRank称为网页等级。
Google的PageRank根据网站的外部链接和内部链接的数量和质量俩衡量网站的价值。PageRank背后的概念是,每个到页面的链接都是对该页面的一次投票,被链接的越多,就意味着被其他网站投票越多。这个就是所谓的“链接流行度”――衡量多少人愿意将他们的网站和你的网站挂钩。
PageRank这个概念引自学术中一篇论文的被引述的频度――即被别人引述的次数越多,一般判断这篇论文的权威性就越高。Google有一套自动化方法来计算这些投票。Google的PageRank分值从0到10;PageRank为10表示最佳,但非常少见,类似里氏震级(Richterscale),PageRank级别也不是线性的,而是按照一种指数刻度。这是一种奇特的数学术语,意思是PageRank4不是比PageRank3好一级――而可能会好6到7倍。因此,一个PageRank5的网页和PageRank8的网页之间的差距会比你可能认为的要大的多。PageRank较高的页面的排名往往要比PageRank较低的页面高,而这导致了人们对链接的着魔。在整个SEO社区,人们忙于争夺、交换甚至销售链接,它是过去几年来人们关注的焦点,以至于Google修改了他的系统,并开始放弃某些类型的链接。比如,被人们广泛接受的一条规定,来自缺乏内容的“linkfarm”(链接工厂)网站的链接将不会提供页面的PageRank,从PageRank较高的页面得到链接但是内容不相关(比如说某个流行的漫画书网站链接到一个叉车规范页面),也不会提供页面的PageRank。Google选择降低了PageRank对更新频率,以便不鼓励人们不断的对其进行监测。
pagerank_pagerank -发明经过
在完成网络搜索并存储了链接图之后,还需要找到评定等级的方法。这时佩奇发现,对所有指向某网页的链接数量的计算对于确定该网页的等级具有指导意义,这种方法带来了新的挑战――困难而复杂的递归性数学运算。布林的数学天赋提供了帮助。他们发明了一种新算法,基于重要的来源链接来评价网页的重要性,这种算法以佩奇的姓(Page)命名,因此叫佩奇排名(PageRank)。
在佩奇和布林发明了PageRank算法后,他们编写了一个PageRank搜索工具,然后用PageRank来为结果的相关性排序。他们发现,网络越大,链接越多,这个引擎提供的结果就越准确,于是,他们将新引擎命名为Google,这是googol的变体,Googol是一个数字名词,表示10的100次方。1996年8月,他们在斯坦福的网站上发布了第一个Google版本。
pagerank_pagerank -正确理解
googlepagerank一般一年更新四次,也有2个月就更新一次的例子出现。所以刚上线的新网站不可能获得PR值。网站很可能在相当长的时间里面看不到PR值的变化,特别是一些新的网站。
要时刻保持一个整体思路并记住以下几点:
・Google的排名算法并不是完全基于外部链接的?
・高PageRank并不能保证Google高排名?
・PageRank值更新的比较慢,看到的PageRank值可能是三个月前的值,决定排名的因素可以有上百种。
pagerank_pagerank -如何查看网站PageRank
1、使用站长类工具即可查询
2、安装google工具条
pagerank_pagerank -算法总结
1.PageRank
基本思想:如果网页T存在一个指向网页A的连接,则表明T的所有者认为A比较重要,从而把T的一部分重要性得分赋予A。这个重要性得分值为:PR(T)/C(T)
其中PR(T)为T的PageRank值,C(T)为T的出链数,则A的PageRank值为一系列类似于T的页面重要性得分值的累加。
优点:是一个与查询无关的静态算法,所有网页的PageRank值通过离线计算获得;有效减少在线查询时的计算量,极大降低了查询响应时间。
不足:人们的查询具有主题特征,PageRank忽略了主题相关性,导致结果的相关性和主题性降低;另外,PageRank有很严重的对新网页的歧视。
2.Topic-Sensitive PageRank(主题敏感的PageRank)
基本思想:针对PageRank对主题的忽略而提出。核心思想:通过离线计算出一个PageRank向量集合,该集合中的每一个向量与某一主题相关,即计算某个页面关于不同主题的得分。主要分为两个阶段:主题相关的PageRank向量集合的计算和在线查询时主题的确定。
优点:根据用户的查询请求和相关上下文判断用户查询相关的主题(用户的兴趣)返回查询结果准确性高。
不足:没有利用主题的相关性来提高链接得分的准确性。
3.Hilltop
基本思想:与PageRank的不同之处:仅考虑专家页面的链接。主要包括两个步骤:专家页面搜索和目标页面排序。
优点:相关性强,结果准确。
不足:专家页面的搜索和确定对算法起关键作用,专家页面的质量决定了算法的准确性,而专家页面的质量和公平性难以保证;忽略了大量非专家页面的影响,不能反应整个Internet的民意;当没有足够的专家页面存在时,返回空,所以Hilltop适合对于查询排序进行求精。
pagerank_pagerank -影响因素
1与pr高的网站做链接
2内容质量高的网站链接
3加入搜索引擎分类目录
4加入免费开源目录
5你的链接出现在流量大、知名度高、频繁更新的重要网站上
6google对PDF格式的文件比较看重
7安装Google工具条
8域名和tilte标题出现关键词与meta标签等
9反向连接数量和反向连接的等级
10Google抓取您网站的页面数量
11导出链接数量
pagerank_pagerank -缺点局限
从1998年起,PageRank经过多年运转,取得了巨大成功,同时它的缺点也暴露出来。因为它对网页的排序是静态的,只考虑页面在整个互联网中的拓扑结构,所以,有人可以作弊,通过多做一些超级链接来显示页面的重要性,因此有这样的公司,自己找个服务器,让许多页面互相链接,如果对方给钱,公司就将你的页面链接上去,从而恶意提高页面排序。谁能控制超级链,谁就能控制页面的重要性。