php登录抓取网页指定内容(wordpress建站教程:noindex指令分享建站的处理方法!)

优采云 发布时间: 2022-04-13 21:28

  php登录抓取网页指定内容(wordpress建站教程:noindex指令分享建站的处理方法!)

  (此处已添加小程序,请到今日头条客户端查看)

  

  继续分享WordPress建站教程,今天我们来说说noindex命令。有的朋友在使用wordpress建站时可能会设置为禁止先爬。如果在robots.txt文件中直接设置禁止爬取,则什么都没有,后面可以修改。但是,如果你在创建wordpress的时候勾选了【建议搜索引擎不要索引这个站点】,那么可能会出现一些问题,因为这个选项会在你的网站中添加一个noindex标签,与百度。影响,因为百度不支持,但是对谷歌和必应影响很大,因为这两个搜索引擎会严格执行这个指令,优先级高于robots.txt文件。

  

  ​如上图所示,如果你的wordpress站点之前勾选了【建议搜索引擎不要索引这个站点】,即使你后面取消了,你的网站中仍然会存在noindex标签,很顽固!这对正在搭建WordPress外贸网站的用户影响很大。如果处理不当,会直接影响你外贸建站的效果,因为Bing和Google基本不会收录你的网站!那么该怎么办?接下来,月然建展给大家分享一下处理方法。

  //移除 meta robots,代码由悦然wordpress建站收集整理

add_filter('wp_robots', 'fanly_basic_robots_remove_noindex', 999);

function fanly_basic_robots_remove_noindex( $robots ){

return get_option('blog_public') ? [] : $robots;

}

  将以上代码添加到当前wordpress网站主题的functions.php文件中,保存后再清除缓存生效。它也可以直接添加到代码片段插件中。

  

  ​一般情况下,只要不限制网站的抓取,谷歌搜索网站收录的速度是比较快的。一周左右收到基本没问题。它可能在一两天内很快。可以收录主页。如上图所示,删除noindex标签后的第二天,月然网站的一个网站被Google搜索到了收录。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线