网站内容抓取(SEO历史网站不被收录的四个步骤及解决方法介绍)

优采云 发布时间: 2022-03-12 23:16

  网站内容抓取(SEO历史网站不被收录的四个步骤及解决方法介绍)

  收录是网站关键词的排名依据,而网站不收录收录,这是所有SEOer都头疼的问题。

  首先,我们将介绍一个搜索引擎收录必须经过的四个步骤:爬取、过滤、索引和展示。通常的收录 量是指搜索引擎显示的网站 网页的数量。

  这些 SEO 禁区导致 网站内容不收录

  1、网站作弊SEO,或有黑帽SEO历史

  网站有SEO作弊,比如最常见的关键词叠加、内链叠加、快速排名等;或者网站域名曾经有黑帽SEO的历史,正在被搜索引擎惩罚阶段。这种情况可能会导致 网站 内容不是 收录。

  2、robots.txt 用于阻止搜索引擎抓取

  抓取是搜索引擎 收录 必须经过的四个步骤中的第一步。robots文件禁止被搜索引擎抓取,网站内容不能为收录。但是还有另外一种情况,就是robots.txt文件已经屏蔽了搜索引擎,屏蔽期间搜索引擎多次访问无果。之后,即使 robots.txt 文件被解锁,搜索引擎也可能无法抓取它。

  解决办法是:①验证百度站长工具;② 网页抓取栏中有“robots”项,用于检测和更新robots文件;③ 提交网页链接。

  3、网站不稳定

  网站有以下几种情况,很容易导致网站的内容不是收录:

  A. 网站 经常修改网站 标题;

  B、替换网站域名、空间、IP;

  C、替换网站模板;

  D. 网站 频繁修改;

  以上情况会改变搜索引擎对网站的固有印象。网站更改后,搜索引擎需要重新判断网站。在此期间,网站的更新内容可能不是收录。

  4、网站未分析收录常见情况

  A. 搜索引擎无法抓取

  网站重要页面入口采用js设置,或大量使用iframe框架结构,会导致网站内容无法被百度抓取。

  B. 搜索引擎根本不抓取

  分析网络日志或者查看百度站长工具的“爬取频率”,看看百度有没有爬取记录。如果没有,需要站长主动提交。

  C. 有抓取,但没有 收录

  在文章的开头,我们已经说过网站内容必须经过四个步骤才能被搜索引擎收录使用,而爬取只是第一步。爬不爬可能有两种情况收录:

  ①网站内容被百度爬取后,已入索引库,暂时未发布;这种情况在新站经常出现,可能一个月只有收录一个主页,然后突然有一天收录的量暴涨,为此站长只需要不断更新;

  ②网站内容质量差导致网站not收录,往往是网站not收录的根本原因。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线