如何让百度收录pages.xml网页嘴上上自动生成
优采云 发布时间: 2021-05-24 21:24如何让百度收录pages.xml网页嘴上上自动生成
重复的内容收录重量
如果在不同位置发布相同内容,搜索引擎将仅选择其中一个,而另一个将跳过收录。从长远来看,引擎会发现您有过多的重复内容并将其降低网站信誉会逐渐降低
在什么情况下需要rel =“ canonical”标签
根据搜索引擎的规则,您可以通过标签指定要收录内容的域名,即:rel =“ canonical”标签,该标签也可以由插件自动生成:
安装插件:npm install --save hexo-auto-canonical add in head.ejs,然后清理并重新生成,它将根据_config.yml中配置的url域名生成规范标签。
sitemap.xml 网站 map
大多数搜索引擎都会检索您提交的网站地图,这意味着您需要告诉搜索引擎您拥有哪些页面,并且为此使用了sitemap.xml,因此让我们使用hexo Sitemap插件自动生成:
首先安装插件:npm install hexo-generator-sitemap
将站点地图路径配置添加到十六进制的_config.yml
1
2
sitemap:
path: sitemap.xml
这时,hexo clean hexo g可以看到公共目录中还有一个附加的sitemap.xml文件。通过将该文件上传到Google和bing的网站管理员后台,引擎可以抓取我们的网页。
附加bing和google的背景地址:google:bing:尚未上传站点地图
将中文网页名称转换为固定字符串
默认情况下,由hexo生成的页面是您的标题名称,即,如果标题为中文,则网站的访问路径也为中文。这不利于搜索引擎收录。让我们使用一个插件来解决这个问题。
安装缩短链接插件npm install hexo-abbrlink --save
在hexo的_config.yml中添加以下配置:
1
2
3
4
5
6
7
8
permalink: posts/:abbrlink.html
abbrlink:
alg: crc32 # 算法:crc16(default) and crc32
rep: hex # 进制:dec(default) and hex
permalink_defaults:
pretty_urls:
trailing_index: true # Set to false to remove trailing 'index.html' from permalinks
trailing_html: true # Set to false to remove trailing '.html' from permalinks
安装后,clean hexo g将发现生成的网页名称不再是中文,而是固定的字符串,并且访问路径也变为posts / xxx.html。这种简单的访问路径比较有利于搜索引擎收录。
如何制作百度收录 github页面网页
我没有说,但是我的身体不得不做出让步。我们大多数中国网民仍然习惯使用百度搜索(毕竟,我别无选择)。读文章不浪费人吗?
由于github阻止了百度爬虫,因此无法直接提交sitemap.xml 收录。解决方案如下:
选项1的具体实现:否
方案2的具体实现:首先将gitee的公钥上传到github等上,创建一个仓库,然后在_config.yml中添加另一个存储库:
1
2
3
4
5
6
deploy:
type: git
repo:
github: git@github.com:userName/userName.github.io.git
gitee: git@gitee.com:userName/userName.git
branch: master
然后hexo cleanhexo ghexo d,上传完成。
应该注意的是,gitee的十六进制部署需要手动操作,并且非常慢,不需要github页面,gitee pages操作的条目位于项目页面->右上角的服务选项卡-> gitee页面
2020-12-3更新
我尝试了一下,发现百度可以抓取github页面,并且不再需要重复部署!