网站内容抓取(SEO历史网站不被收录的四个步骤及解决方法介绍)
优采云 发布时间: 2022-03-12 23:16网站内容抓取(SEO历史网站不被收录的四个步骤及解决方法介绍)
收录是网站关键词的排名依据,而网站不收录收录,这是所有SEOer都头疼的问题。
首先,我们将介绍一个搜索引擎收录必须经过的四个步骤:爬取、过滤、索引和展示。通常的收录 量是指搜索引擎显示的网站 网页的数量。
这些 SEO 禁区导致 网站内容不收录
1、网站作弊SEO,或有黑帽SEO历史
网站有SEO作弊,比如最常见的关键词叠加、内链叠加、快速排名等;或者网站域名曾经有黑帽SEO的历史,正在被搜索引擎惩罚阶段。这种情况可能会导致 网站 内容不是 收录。
2、robots.txt 用于阻止搜索引擎抓取
抓取是搜索引擎 收录 必须经过的四个步骤中的第一步。robots文件禁止被搜索引擎抓取,网站内容不能为收录。但是还有另外一种情况,就是robots.txt文件已经屏蔽了搜索引擎,屏蔽期间搜索引擎多次访问无果。之后,即使 robots.txt 文件被解锁,搜索引擎也可能无法抓取它。
解决办法是:①验证百度站长工具;② 网页抓取栏中有“robots”项,用于检测和更新robots文件;③ 提交网页链接。
3、网站不稳定
网站有以下几种情况,很容易导致网站的内容不是收录:
A. 网站 经常修改网站 标题;
B、替换网站域名、空间、IP;
C、替换网站模板;
D. 网站 频繁修改;
以上情况会改变搜索引擎对网站的固有印象。网站更改后,搜索引擎需要重新判断网站。在此期间,网站的更新内容可能不是收录。
4、网站未分析收录常见情况
A. 搜索引擎无法抓取
网站重要页面入口采用js设置,或大量使用iframe框架结构,会导致网站内容无法被百度抓取。
B. 搜索引擎根本不抓取
分析网络日志或者查看百度站长工具的“爬取频率”,看看百度有没有爬取记录。如果没有,需要站长主动提交。
C. 有抓取,但没有 收录
在文章的开头,我们已经说过网站内容必须经过四个步骤才能被搜索引擎收录使用,而爬取只是第一步。爬不爬可能有两种情况收录:
①网站内容被百度爬取后,已入索引库,暂时未发布;这种情况在新站经常出现,可能一个月只有收录一个主页,然后突然有一天收录的量暴涨,为此站长只需要不断更新;
②网站内容质量差导致网站not收录,往往是网站not收录的根本原因。