网站内容更新机制(SEOER爬虫会更加青睐内容源更新频繁的网站吗?)

优采云 发布时间: 2022-04-15 22:32

  网站内容更新机制(SEOER爬虫会更加青睐内容源更新频繁的网站吗?)

  很多SEOER经常说网站日志中304的返回值是什么?

  经常有站长抱怨蜘蛛爬取的返回码总是304,爬取的次数越来越少。为了自身的用户体验,搜索引擎会尽最大努力提高检索调用率、准确性和新鲜度,这将导致引擎不得不专注于具有高质量内容源的网站。只有这样,搜索结果的质量才能更符合搜索者的体验。

  由此,我们认为搜索引擎爬虫会更喜欢内容源更新频繁的网站。获取网站的频率根据一定时间内获取网站返回的状态码来调整。如果网站在一段时间内一直处于[304: No change]状态,引擎爬虫可能会减少网站的爬取次数。相反,如果网站的变化频率非常快,每次爬取都能得到一个新版本,那么爬虫的回访率会随着时间的推移而增加。

  不管是少爬还是304,这都是现象,不是问题的原因。假设网站返回200,能否达到提升排名、带来流量的目的?相比之下,304应该考虑什么原因呢?更改 304 会对 网站 目标产生什么影响?不要忽视整体目标,强调过程细节,为200解决304。

  304状态是如何产生的?

  为了提高网站的访问速度,服务器对之前访问过的一些页面建立了缓存机制。当客户端请求这些页面时,服务端会根据缓存的内容判断页面是否和之前一样,如果相同则直接返回 304 ,此时客户端调用缓存的内容,无需执行第二次下载。可以说,304在一定程度上起到了降低服务器带宽、提高蜘蛛爬取效率的作用。

  304状态的原因是什么?

  1、页面更新周期长或未更新

  2、纯静态页面或强制静态html

  304状态处理思路?

  1、先细分产生304的页面,什么样的页面返回304?这些页面应该返回 304 吗?

  2 这些页面是如何生成的?有更新机制吗?更新机制是否与蜘蛛爬行 网站 的频率相匹配?

  3、页面更新区的位置合理吗?是否位于页面主要内容的承载区

  太多的 304 状态码会导致以下问题:

  1、网站快照已停止

  2、收录减少

  3、体重下降

  那么如何减少304返回码呢?

  据我所知,首先内容更新要迎合百度蜘蛛,分析日志,记录蜘蛛的访问时间。大致可以得到蜘蛛的访问频率,然后以此为基础,更新文章:肯定是原创+转载,不是纯采集。转载也需要最新最好的优质资源。让蜘蛛来这里吃点东西。从而返回更多 200 个正常代码。

  其次,最好添加一个交互部分。现在Da网站基本都做到了,比如评论、留言等。Da网站更新后变化可能很小,但是有了这些互动,用户就会在上面发点东西,网站会有很多新东西。返回搜狐,查看更多

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线