伪原创新闻(健康饮食那么,百万伪原创数据,如何提升收录量?)

优采云 发布时间: 2022-01-27 05:06

  伪原创新闻(健康饮食那么,百万伪原创数据,如何提升收录量?)

  这个版块其实挺忙的,总是在解决一些无伤大雅的问题,大概大部分时间都在处理收录,而且每天都会有私信讨论页面没有收录的问题很久。

  尤其是对于一些数据量比较大的网站,我们在谈判合同的时候总是觉得很尴尬。一般情况下,对方的大部分需求都是先解决收录的问题,而我们后面会讨论排名问题。

  简单来说:如果你想做对方的事,得到收录是前提,但我们都知道,有时候“收录与否”对于权重来说并不太直观整个网站和产品的转换。影响。

  理论上,只要有一个页面可以在SERP中展示,我们就可以做很多相关的事情,但毕竟甲方的需求,你懂的,还是要完成的。

  接下来,我简单描述一种情况:

  域名年龄:2-3年

  域名后缀:com

  网站备案:企业站

  网站更新数据量:150,000+

  网站索引:1.50,000

  网站收录金额:1.50,000+

  网站库存数据量:90万+(全网采集伪原创)

  网站 日均更新量:10000+

  平均每天蜘蛛爬行:少于 1000

  网站主题:健康饮食

  

  那么,拥有数百万的伪原创 数据,如何增加收录 的容量呢?

  结合以往网站增加指数量的经验,蝙蝠侠IT将通过以下内容进行阐述:

  1

  网站诊断

  一般来说,影响页面收录的一些核心因素主要包括:内容、结构、速度,这里我们一开始已经说得很清楚了,内容就是全网采集伪原创@ >,简单看了一下,基本整合了各大知名网站的内容。

  通过伪原创工具,批量组织的伪原创内容,甚至部分页面的内容结构,都没有得到合理的调整。

  以目前的情况来看,以一个月的调整周期,短期内改变内容本身的质量显然是不现实的。因此,我们只能从结构等另外两个渠道来考察原因。

  经常回顾,我们发现:

  整个站点结构呈现多目录的情况,一级目录多达84个。

  网站内容百科首页没有任何内部链接。

  网站列表页面缺少侧边栏调用。

  网站新内容,有些页面没有明显的时间因素。

  网站页面标题,多级分类名称显示,让标题文字显示超长。

  每日新增内容难以在网站首页和非相关页面展示。

  PC端页面访问速度为3-4秒。

  没有 HTML网站 地图。

  网站已经修改,链接很多,数据量1万左右。

  简单来说,其实网站结构问题并不是特别大。最初定位问题的核心更多是基于内容采集和伪原创的问题,但是我们还是需要给我们想出一个解决方案来帮助用户增加页面收录的体积. 我们之前刚好操作过一个很相似的网站,情况也差不多,所以我们在短期内迅速调整了相关的现场策略。

  2

  解决方案

  标准化页面标题

  形式为:内容、列表、标签名+品牌词,如:SEO标题-品牌词

  将整个站点的所有页面标题调整为一个简短的形式。这个时候,一些小伙伴会担心在大量标题调整时会出现权限减少的问题。我们不能完全保证这种情况不会发生,但我们需要在有限的时间段内坚强起来。提前调整。

  根据实际情况解决问题。

  调用词库搜索结果

  采取这种策略的策略主要是“一石二鸟”。前期是用来辅助增加页面收录的体积,后期则是提升整个网站权重的伏笔。整合行业词库后,我们选择调用生成30万个长尾词。的搜索结果页面。(使用相同的目录)

  由于对方网站前期的分类比较多,这让我们可以创建一个搜索结果页面,并提供一定的页面结构做支撑,让搜索结果页面看起来比较丰富。

  每个搜索结果页面匹配目录调用当前的相关结果。

  同时,确保搜索结果页面是动态的。在搜索结果页面中,我们添加了调用日的最新内容、随机内容和随机搜索结果页面。

  新增页面内容列表,确保显示时间因素。

  构建地图的 HTML 版本

  在这个过程中,由于早期目录数量众多,短期内我们进行有效的目录合并是非常不现实的。因此,在实际操作过程中,我们创建了 5 个 HTML 版本的 网站 地图。

  每个页面平均显示20个分类,每个小分类调用最新随机的内容进行合理展示。

  单页顶部导航显示5个HTML版本的链接入口,提供搜索引擎蜘蛛进行爬取。

  构建网站内部链结构

  内部链结构主要分为两部分。一部分是现有站点中核心排名关键词所需的栏目和内容页面之间的关联。其次,一个策略主要是识别长尾关键词添加一个新页面,并将这部分页面导入到现有页面中。

  这样,我们在站点中基本形成了一个相对循环的状态,单页->搜索结果聚合页->每个单页显示,然后再循环。

  采用这种策略的核心目的是希望站点上的每个页面都有被爬取和被多次爬取的概率,从而增加页面的收录量。

  指定输出频率

  网站原因是API自动提交的时间段比较集中。调整后,我们采取了两种策略。白天,我们平均每天提交 10,000 个新页面,并且每小时平均分配。晚上,我们也做了同样的事情。提交一万个长尾词的搜索结果页面,采用的策略也是均匀分布。

  调整 网站 速度

  与对方操作深入技术沟通,合理优化数据库维护策略,同时升级网站的配置和带宽,原计划开启百度云加速,后来我们实测了页面打开速度可以有效控制在1.5秒-2秒PC端。

  3

  战略成果

  调整后的营业时间:35天。

  网站收录新增数量:7.80,000,目前总量接近100,000。

  网站收录 率:近13%,15+30+30=750,000,页面已提交。

  现有 收录 体积翻倍:近 7 倍。

  新增索引量:采集伪原创 70,000 页,搜索结果页 8,000。

  网站基重:1 到 2

  总结:在一定程度上,页面结构和速度决定了一个页面被索引的概率。当整个网站的指标变得比较优质时,基础页面的索引也会有明显的提升。以上内容还有很多细节是基于时间因素的,没有深入讨论。值得思考的是整个站点的权重变化。以上内容仅供参考!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线