robots文件 如何正确的使用robots文件

  robots文件作为国际上通用的搜索引擎规则,可以规定搜索蜘蛛对网站可以爬行的范围,对某一些不必要的网页或者不想让搜索引擎蜘蛛发现的网页,可以在搜索引擎中列出,但是如果滥用robots文件,可能会导致网站大量网页甚至整个站点,都不被搜索引擎收录,如何正确的使用robots文件,就变的很重要。

  为什么要使用robots文件?

  搜索引擎蜘蛛在爬行网站的过程中,会首先在网站的根目录下,查找是否存在一个叫robots的纯文本文件,这个文件可以指定搜索引擎蜘蛛抓取的网页范围。

  robots文件放在哪里?

  对于普通网站来说,robots文件放在网站的根目录下即可,网站http://www.example。com/,那么,robots的访问地址就是http://www.example.com/robots.txt,观察下很多网站都存在robots文件,尤其是淘宝的 www.taobao.com/robots.txt,可以发现,它禁止了百度蜘蛛的爬行。

  robots文件中,各条指令的用法?

  一个空的robots文件,写法是这样的:

  User-agent: *

  Allow: /

  表示允许所有搜索引擎蜘蛛爬行

  如果网站还没有准备好,禁止蜘蛛爬行,则robots应该这样写:

  User-agent: *

  Disallow: /

  相对于小说网站来说,如果不希望蜘蛛爬行网站的管理员目录,可以在robots文件里,这样写:

  User-agent: *

  Disallow: /admin/

  还有一些robots文件中,可以禁止如何你想禁止的文件,比如:

  禁止蜘蛛爬行所有.jpg、.gif图片,robots写法为

  User-agent: Baiduspider

  Disallow: /*.jpg$

  Disallow: /*.jpeg$

  禁止爬行以file开头的文件夹中,所有的文件,robots写法为

robots文件 如何正确的使用robots文件

  User-agent: Baiduspider

  Disallow: /file~/

  只允许蜘蛛爬行所有html文件

  User-agent: *

  Allow: /*.htm$

  Disallow: /

  其实,对于小说站来说,需要禁止的文件不多,对robots文件有一个大致的了解就可以了,需要注意的是,在还没有彻底理解robots的用法规则之前,不要随便使用,防止对网站带来不必要的影响。本文由提供帅老公是高中生全文阅读的Q猪文学站(http://www.qzread.com/)原创发布,转载请注明出处。

  

爱华网本文地址 » http://www.413yy.cn/a/2969471/236052926.html

更多阅读

怎样正确的使用万能充电器? 万能充电器如何使用

万能充电器现在是手机用户必备的充电器,因为它携带方便,可以将电池卸下来为电池进行充电,但是又大部分初次使用万能充电器的用户,就不知道如何正确使用,因为手机电池的充电接触点有三个极,而万能充电器只有两个极点,这就有点让人迷惑了。我

防晒霜隔离霜顺序 隔离霜和防晒霜的区别?如何正确顺序使用

隔离霜和防晒霜的区别?如何正确顺序使用――简介和补水保湿一样,隔离防晒也常被混为一谈,虽然现在很多产品的隔离与防晒功效融合在一起的,但是隔离防晒的区别还是很明显的。隔离霜与防晒霜的功能明显不同,这也决定了防晒与隔离的先后顺

如何正确使用发膜 如何正确的使用发膜?

?????? 一到冬季,会发现一个比疲惫素颜更雷人的现象:很多MM整体发质缺乏光泽、发尾细长又干燥。要知道,没有光泽和弹性的头发,看来跟老化的皮肤没两样,疲惫、沧桑、无生机。遗憾的是很多人会很在意脸部问题,却不会在意发质不好对形象的影

使用漱口水还用刷牙吗 如何正确选择使用漱口水

如何正确选择使用漱口水――简介漱口水做为清洁口腔卫生的保健用品,逐渐受到大家的亲昧。超市和药店里的漱口水摆放的琳琅满目、种类繁多,但是大家对如何正确选择使用漱口水却犯了难。如何正确选择使用漱口水――方法/步骤如何正确选

声明:《robots文件 如何正确的使用robots文件》为网友秋至夏未止分享!如侵犯到您的合法权益请联系我们删除