如何让百度快速收录网站的11个小技巧(下)
优采云 发布时间: 2021-04-29 00:27
如何让百度快速收录网站的11个小技巧(下)
如果百度或Google没有收录您的网站,则网站自然不会出现在搜索结果中,并且无法获得搜索引擎的自然流量。关于百度收录的问题也是网站站长圈子中的常见话题。
今天,我将与您分享11条有关如何使百度快速运行的秘诀收录 网站(不仅适用于百度,而且适用于所有搜索引擎)。本文将教您如何解决以下三个问题:
您的整个网站未编制索引;有些页面被索引,而另一些则没有;新发布的页面不会立即被编入索引。
但是首先,请确保我们保持一致并完全理解索引的含义。
什么是爬网和索引编制?
无论是百度还是Google,它都会通过爬网发现新网页,然后将这些网页添加到索引中。他们使用称为Googlebot和Baiduspider的网络爬虫来执行此操作(如果在WordPress 网站上安装了Spider Analyzer,则会发现许多类型的爬虫)。
困惑吗?让我们解释一些名词:
当您在百度或Google上搜索内容时,实际上是在要求百度或Google返回其索引中的所有相关页面。由于通常有成千上万个满足要求的网页,因此百度或Google的排名算法将尝试对网页进行排名,以便您首先看到最佳和最相关的结果。
我想在这里指出的一点是,索引编制和排名是两件事。
索引用于参与,排名用于获胜。
如果您不参加,就不可能获胜。
如何检查您的页面是否被索引
输入百度或Google搜索引擎,然后按如下所示搜索站点:
此处的数字显示百度或Google索引页面的大概数量。
如果要检查是否为特定页面建立索引,也可以在以下网站上进行操作:详细的URL(此方法仅适用于Google,百度直接搜索URL地址),或使用搜索推送收录 [插件的收录查询功能(仅支持百度收录查询)。
如果没有结果,则该页面未编制索引。
如果您是Google Search Console的用户,则只需查看覆盖率报告即可找到准确的索引数据。您只需要输入:
Google搜索控制台>索引>覆盖范围
检查有效页数(包括警告页数)。
如果这两个数字的总和不为零,则Google至少会为您的网站上的某些页面编制索引。如果没有,那么您可能会遇到严重的问题,因为没有页面被索引。
如果您想在百度搜索中查询网站的整体情况收录,也可以通过百度搜索资源平台进行查询。
百度搜索资源平台>搜索服务>索引量
提示。不是Google Search Console用户或百度搜索资源平台?免费注册一个。每个关心从Google或百度获取流量的网站管理员都应使用Google Search Console或百度搜索资源平台,这一点非常重要。此外,还可以通过百度统计信息查看百度索引量:百度统计>优化分析>百度索引量。
除了上述站点命令方法外,您还可以使用Google Search Console检查特定页面是否被Google编制了索引。您只需要将页面URL放入URL检测工具中即可。
如果该页面已建立索引,它将显示“ URL在Google上”。
如果该页面未编制索引,则将在此处显示“ URL不在Google上”
如何制作Google或百度收录 网站页面
您的网站或信息页不是Google还是百度收录?
如果它是Google搜索引擎,则可以尝试以下操作:
进入Google Search Console。输入URL检测工具。将要索引的URL粘贴到搜索框中。等待Google检测到该URL。点击“请求编制索引”按钮。
如果它是百度搜索引擎,则可以尝试:
进入百度搜索资源平台。输入链接提交或普通收录-资源提交-手动提交。将百度收录的URL粘贴到指定的位置,然后确认提交。等待百度蜘蛛爬行收录。
发布新帖子或页面时,最好这样做。您实际上是在告诉Google您已在网站上添加了一些新内容,他们应该将其签出。
但是,请求被索引到收录不太可能解决旧页面的索引问题,而这只是最原创的方式。提交链接不能确保您的URL必须为收录,尤其是百度。
如果您想完全解决网站搜索引擎收录问题,请按照下面的清单进行诊断和解决。
下面是一些解决方案的快速访问链接,您可能已经尝试过其中的一些解决方案:
移除Robots.txt中的爬行障碍物。删除不必要的noindex标记。包括需要在网站映射中建立索引的页面。删除不必要的规范标签。检查页面是否为孤岛页面。修复不必要的内部nofollow链接。将内部链接添加到“功能强大”页面,以确保该页面是唯一且有价值的。删除或优化低质量的页面(优化“抓取预算”)。建立高质量的外部链接。使用所有可用的推送方法。 1)删除Robots.txt中的爬网,并设置障碍物
Google或百度没有为整个网站编制索引?这可能是由于robots.txt文件中的爬行障碍所致。
转到/robots.txt以查看详细问题。
检查右下两段中是否有任何代码:
([1)这样的规则将告诉Google不要为您的网站编制索引;
用户代理:GooglebotDisallow:/
((2)这样的规则将告诉百度不要为您的网站编制索引;
用户代理:BaiduspiderDisallow:/
([3)这样的规则将告诉所有搜索引擎不要为您的网站编制索引;
用户代理:*不允许:/
以上三个规则不允许搜索引擎蜘蛛抓取网站上的任何页面。要解决此问题,只需删除它们即可。
如果百度或Google只是没有为单个网页编制索引,则也可能是由于robots.txt中的代码引起的。
要检查由于robots.txt 收录,Google搜索引擎是否未为单个网址建立索引:
请将该网址粘贴到Google Search Console中的网址检测工具中。点击覆盖率部分以显示更多详细信息,然后查找“是否允许抓取?否:被robots.txt阻止”错误。
这意味着该页面已被robots.txt阻止。
要检查由于robots.txt,百度收录是否未为单个URL编制索引:
进入与网站关联的百度搜索资源平台,找到漫游器菜单,选择相应的站点名称,单击“检测并更新”,验证后,输入要验证的URL地址,然后单击“验证”。 (但是此功能不是很容易使用,将无法使用,该功能)
在这种情况下,请重新检查robots.txt文件中与该页面或相关目录有关的“禁止”规则。
如果需要,请删除此代码。
2)删除不必要的noindex标记
如果您告诉Google不要将网页编入索引,则Google不会将其编入索引。这可以使页面的一部分保持私密性。有两种方法可以做到这一点:
方法1:元标记
如果以下任何代码显示在页面中,则Google或百度收录不会将其编入索引:
这是爬虫的元标记,它告诉搜索引擎它们是否可以为页面编制索引。
提示。核心参数是“ noindex”。如果显示“ noindex”,则表示该页面未编制索引。
如果要在Internet上查找所有带有noindex meta标签的页面,则只需使用Ahrefs的网站诊断工具进行测试。然后输入“可索引性”报告。查找“ Noindex页面”提示。
单击以查看所有被阻止的页面。删除需要索引的页面的noindex元标记。
方法2:X‑Robots-Tag
Web采集器遵循X-Robots-Tag HTTP响应标头。您可以使用服务器端脚本语言(例如PHP)、. htaccess文件的内容,或更改服务器配置以实现此效果。
Google Search Console中的URL检查工具可以告诉您此标头是否阻止Google抓取页面。只需输入URL,然后查找“是否允许索引?”否:在“ X-Robots-Tag” http标头中检测到“ noindex”标记。
如果要检测整个站点是否存在此类问题,可以使用Ahrefs的网站诊断工具,然后在“页面资源管理器”过滤器框中选择“ HTTP标头中的机器人信息”。机器人信息)”以查看:
同时,告诉网站开发人员修改要编制索引的页面的页眉。
推荐阅读:对特定的SEO使用X-Robots-Tag HTTP标头:提示和技巧
3)包括要在网站地图中建立索引的页面
网站该地图将说明搜索引擎(例如Google或百度网站)上的哪些页面很重要,哪些不重要。它还可以为搜索引擎的抓取频率提供一些指导。
在通常情况下,搜索引擎应该能够在网站上找到网页,而不管它们是否在站点地图中,但是将它们收录在网站地图中仍然是一个好习惯。毕竟,百度或Google无需执行无意义的爬网。
要检查网页是否在您的站点地图中,请使用Google Search Console中的URL检查工具。如果您看到“ URL不在Google上”和“站点地图:不适用”,则表明该URL不在您的站点地图中或未编入索引。
采集失败,请手动处理
不使用Google Search Console?输入您的网站地图,通常是以下地址:/sitemap.xml,然后搜索此页面的URL。
或者,如果要查找不在网站映射中但需要建立索引的所有页面,则只需使用Ahrefs 网站诊断工具。输入页面浏览器(页面分析),然后进行如下过滤:
这些页面应该在您的网站地图中,因此添加它们。添加后,使用下面的Ping方法告诉Google您已经更新了此网站地图。
:///sitemap_url.xml
用您的网站地图地址代替后面的提示,您应该能够收到以下消息:
这将使Google加快对页面的索引编制。
关于生成WordPress 网站 Sitemap
有许多专用于WordPress的SEO优化插件,支持生成Sitemap 网站地图,例如All in One SEO,Yoast SEO,Google XML Sitemap或我们的Smart SEO工具。
Smart SEO Tool插件支持标准XML 网站地图的生成,并且可以将网站的地图更新通知Google和Bing搜索引擎;并且生成的地图文件满足某些搜索引擎的单个文件要求不超过50,000个URL地址的需求。
注意:要提交站点地图,请确保遵循“未编制索引的站点地图地址提交”。
4)删除不必要的规范标签
Canonical标签将告诉搜索引擎哪个版本是页面的首选版本。看起来像这样:
大多数页面没有规范标签,即所谓的自引用规范标签。这告诉搜索引擎(例如Google或百度),页面本身是首选版本,并且可能是唯一版本。换句话说,您要为页面编制索引。
但是,如果您的页*敏*感*词*有不规则的规范标签,则您可能会告诉诸如百度或Google之类的搜索引擎错误的首选版本。在这种情况下,您的页面将不会被索引。
要检测规范标签,您只需要使用Google的URL检测工具(百度似乎没有类似的工具,并且也不太遵循此规则)。如果页面的规范标签指向另一个页面,则可以看到“带有规范标签的替代页面”提示。
如果不应该显示此页面,并且您希望对当前页面进行索引,则只需删除该页面的规范标记即可。
重要提示请注意,规范标签并不总是不好的。大多数带有这些标签的页面都有其原因。如果您看到您的页*敏*感*词*有规范标签,请检查相应的页面。如果确实是页面的首选版本,并且无需索引页面,则应保留规范标记。
如果您想在整个站点上快速找到有问题的规范标签,则可以使用Ahrefs 网站诊断工具进行检测,然后进入Page Explorer(页面分析)并使用以下设置:
这将在站点地图中找到带有非自引用规范标签的页面。几乎可以肯定,您希望对站点地图中的页面建立索引,因此,如果此过滤器返回任何结果,则需要进行进一步的故障排除。
这些页面可能具有错误的规范标签,或者首先不应将它们放置在您的网站地图中。
5)检查页面是否为孤岛页面
岛屿页面是指内部链接不支持的页面。
由于Google通过抓取链接发现了新内容,因此他们无法通过此过程发现孤岛页面。 网站访问者也将无法找到这些内容。
为了检测孤岛页,请尝试使用Ahrefs 网站诊断工具。然后,点击“链接”报告并查看“岛屿页面(无链接)”错误:
这将显示可索引并显示在站点地图上但没有内部链接的所有页面。
重要的是,只有在以下两种情况下才能正常检测到结果:
所有需要索引的页面都在您的网站地图中。在Ahrefs Site Audit的最开始,选择选项以使用网站地图中的页面。
不确定要索引的所有页面都在站点地图中吗?试试这个:
下载网站上的所有页面(可以使用cms进行下载),并获取整个网站(使用诸如Ahrefs 网站诊断之类的工具)并比较两个URL。
在抓取过程中找不到的任何URL都是一个孤岛页面
您可以通过以下两种方法之一来解决孤岛问题:
如果该页面不重要,请将其删除并将其移出网站地图。如果该页面很重要,请将其放入内部链接结构中。 6)修复不必要的内部nofollow链接
Nofollow链接是具有rel =“ nofollow”标签的链接。他们将组织页面权重的传递。同时,百度或Google不会抓取Nofollow链接。
这是Google的解释:
本质上,使用nofollow将导致我们从爬网目录中删除目标链接。但是,如果其他网站链接到目标页面而不使用nofollow,或者这些URL是在站点地图中提交给Google的,则目标页面可能仍会出现在我们的索引中。
简而言之,您需要确保链接到索引页面。
为此,请使用Ahrefs的网站诊断工具捕获网站。检查链接报告中是否出现“页面仅具有nofollow传入内部链接”错误:
假设您希望Google将该页面编入索引,请从这些链接中删除nofollow标记。如果没有,请删除该页面或对该页面执行noindex处理。