php禁止网页抓取(如何禁止搜索引擎抓取我们网站的动态网址(图))
优采云 发布时间: 2022-01-01 19:10php禁止网页抓取(如何禁止搜索引擎抓取我们网站的动态网址(图))
所谓动态网址是指网址中收录哪些内容? , & 等字符网址,如news.php?lang=cn&class=1&id=2。我们开启了网站的伪静态后,对于网站的SEO来说,有必要避免搜索引擎抓取我们的动态网址网站。
你为什么要这样做?因为搜索引擎会在爬取同一个页面两次但最终确定同一个页面后触发网站。具体处罚不明确。总之,不利于网站的整个SEO。那么我们如何禁止搜索引擎抓取我们的动态网址网站?
这个问题可以通过robots.txt文件解决,具体操作请看下面
我们知道动态页面有一个共同的特点,就是会有一个“?”链接中的问号符号,所以我们可以在robots.txt文件中写入如下规则:
用户代理:*
禁止:/*?*
这样可以防止搜索引擎抓取网站的整个动态链接。另外,如果我们只想让搜索引擎抓取特定类型的文件,比如html格式的静态页面,我们可以在robots.txt中加入如下规则:
用户代理:*
允许:.html$
禁止:/
另外,记得把你写的robots.txt文件放在你的网站的根目录下,否则是不行的。此外,还有一个简单的快捷方式来编写规则。登录google网站管理员工具,在里面写规则,生成robots.txt文件即可。