Seoer惜缘举例robots写法规则与含义:设置搜索引擎蜘蛛Spider

优采云 发布时间: 2021-06-05 06:37

  Seoer惜缘举例robots写法规则与含义:设置搜索引擎蜘蛛Spider

  搜索引擎Robots协议放置在网站root目录下的robots.txt文本文件中,其中可以设置搜索引擎蜘蛛爬取规则。设置搜索引擎蜘蛛蜘蛛抓取内容的规则。下面Seoer Xiyuan给出了机器人编写规则和含义的例子: 首先,创建一个robots.txt文本文件,放在网站的根目录下,下面开始

  搜索引擎Robots协议放置在网站root目录下的robots.txt文本文件中,其中可以设置搜索引擎蜘蛛爬取规则。设置搜索引擎蜘蛛蜘蛛抓取内容的规则。下面Seoer Xiyuan给出了机器人书写规则和含义的例子:

  首先创建robots.txt文本文件放在网站根目录下,然后开始编辑设置Robots协议文件:

  一、 允许所有搜索引擎蜘蛛抓取所有目录文件。如果文件没有内容,也意味着所有蜘蛛都可以访问。设置代码如下:

  用户代理:*

  禁止:

  或

  用户代理:*

  允许:/

  二、禁止搜索引擎蜘蛛抓取目录文件,设置代码如下:

  用户代理:Msnbot

  禁止:/

  用户代理:Msnbot

  禁止:/

  比如,如果你想禁止MSN上的蜘蛛,就设置为Msnbot代表MSN上的蜘蛛。如果要禁止其他搜索引擎,只需更改蜘蛛的名称即可。其他蜘蛛的名称如下:

  百度的蜘蛛:baiduspider

  Google 的蜘蛛:Googlebot

  腾讯搜搜:搜搜网

  Yahoo 的蜘蛛:Yahoo Slurp

  Msn 的蜘蛛:Msnbot

  Altavista 的蜘蛛:滑板车

  Lycos 蜘蛛:Lycos_Spider_(T-Rex)

  三、禁止某个目录被搜索引擎蜘蛛抓取,设置代码如下:

  用户代理:*

  禁止:/directory name1/

  禁止:/directory name2/

  禁止:/directory name3/

  把目录名改成你要禁止的目录,防止搜索引擎蜘蛛爬取。如果不写目录名,可能会被搜索引擎抓取。

  四、禁止某个目录被某个搜索引擎蜘蛛抓取,设置代码如下:

  User-agent:搜索引擎蜘蛛名描述(蜘蛛名如上) Disallow:/directory name/ description(此处设置禁止蜘蛛爬行的目录名) 比如你想ban从msn蜘蛛爬取admin文件的文件夹,可以设置代码如下:

  用户代理:Msnbot

  禁止:/admin/

  五、设置某类文件禁止某搜索引擎蜘蛛抓取,设置代码如下:

  用户代理:*

  Disallow: /*.htm description(其中“.htm”表示禁止搜索引擎蜘蛛抓取所有后缀为“htm”的文件)

  六、允许所有搜索引擎蜘蛛访问具有一定扩展名后缀的网页进行抓取,设置代码如下:

  用户代理:*

  允许:.htm$描述(其中“.htm”表示允许搜索引擎蜘蛛抓取所有后缀为“htm”的文件)

  七、只允许某个搜索引擎蜘蛛抓取目录文件,设置代码如下:

  User-agent:搜索引擎蜘蛛名描述(蜘蛛名如上)

  禁止:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线