RobotsMETA标签的缺省值标签(ROBOTSMETA)规则介绍及注意事项

优采云 发布时间: 2021-08-14 00:40

  RobotsMETA标签的缺省值标签(ROBOTSMETA)规则介绍及注意事项

  二、 机器人 META 标签

  1、什么是机器人 META 标签

  Robots.txt 文件主要是限制搜索引擎对整个站点或目录的访问,而Robots META 标签主要是针对特定页面的。与其他META标签(如使用语言、页面描述、关键词等)一样,Robots META标签也被放置在页面上,专门告诉搜索引擎ROBOTS如何抓取页面内容。具体形式类似(见加粗部分):

  ...

  2、Robots META 标签编写方法:

  Robots META标签没有大小写区分,name=”Robots”表示所有搜索引擎,对于特定的搜索引擎可以写成name=”BaiduSpider”。内容部分有四个命令选项:index、noindex、follow 和 nofollow。命令以“,”分隔。

  INDEX 命令告诉搜索机器人抓取页面;

  FOLLOW指令表示搜索机器人可以继续沿着页面上的链接爬行;

  Robots Meta标签默认值为INDEX和FOLLOW,inktomi除外。对于它,默认值为INDEX、NOFOLLOW。

  这种方式有四种组合:

  地点:

  可以写成

  ;

  可以写成

  需要注意的是,上述robots.txt和Robots META标签限制搜索引擎机器人(ROBOTS)抓取网站内容只是一个规则,需要搜索引擎机器人的配合。并非每个机器人都符合要求。

  目前似乎大部分搜索引擎robots都遵守robots.txt的规则,而对于Robots META标签,目前支持的并不多,但正在逐渐增多。比如知名搜索引擎GOOGLE就完全支持,GOOGLE还增加了一个命令“archive”,可以限制GOOGLE是否保留网页快照。例如:

  是指抓取网站上的页面并跟踪页面中的链接,但不要在GOOLGE上保留该页面的网页快照。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线