网站内容采集的利与弊,你晓得吗?

优采云 发布时间: 2020-08-09 15:24

  昨天,木偶写了一篇"学会使用工具剖析网站质量“的文章,其中有位同学看了以后,提到了一个问题:“想了解下采集的症结。”那么,木偶明天就来剖析下采集的问题。

  网站采集,可以简单分为两种情况。

  一种是整站的采集

  网站管理员希望将他人的整站数据下载到自己的网站里或则将他人网站的一些内容保存到自己的服务器上。从内容中抽取相关的数组,发布到自己的网站系统中。有时须要将网页相关的文件也保存到本地,如图片、附件等。

  第二种是网站信息内容的采集

  网站管理员从互联网中搜集各种图片、笑话、新闻、等各种信息,然后分类、编辑,发布到自己的网站系统中。网站管理员通常通过搜索引擎搜索各种关键字获取目标网址,然后再提取网页中的内容。关键字的组织决定获取内容的准确性和数目。由于内容来不同的网站,所以提取内容的方式也各不相同。对于某一类的信息,发布到网站系统的数据结构是相同的。

  首先这类工具有很多,内容的采集一般好多安装在服务器上的建站程序后台都有采集的功能,比如“笑话类、小说类、图片类”等等,一般情况都支持采集。另外也有些采集整站内容的工具,这类工具也十分的多,比如"Teleport Pro"如下图所示:

  

  木偶对采集的简单的介绍就到这儿,相信你们应当能大体了解了采集的含意。操作就不作多讲,言归正传,今天主要来说说网站内容采集的利与弊。

  网站内容采集的利

  一个早已构建好的网站,内容采集主要彰显在特别的便捷,非常的快速才能更新网站的内容,能在短时间之内快速的成为一个内容丰富的网站。好处的确是有,可能在网站页面收录情况十分的可观,也许也会有部份关键词的排行。但是在木偶看来,弊端远远小于这个利。但是也会分情况,除非你的网站不借助搜索引擎获得流量。(木偶不建议,毕竟这些方法是不好的行为)

  网站内容采集的弊病

  1.采集内容的质量你很难控制。

  其他网站的内容不一定适宜你网站的内容。不同的网站都有差别特点的。相同类型的网站,它也不可能是一模一样的。你完全采集了内容,你自己连内容是哪些都不知道,你也不清楚,举个列子:你的网站是一个家装公司的网站,你认为你采集另外一个家装公司的内容合适吗?即使有些关键字、关键词能过滤掉,也会出现文章前后不通顺,甚至内容和你的网站不符合的情况。

  2.网站质量的影响

  这样的网站,搜索引擎是不会喜欢的。前期可能你的收录数目会很不错,但是百度很早就早已官方公告:“针对低质量站点的举措早已生效”。而公告其中很重要的一段话,大家看了都会明白了。如下图所示:

  

  所以,大量采集网站内容,会被搜索引擎直接判断为低质量站点。会没有哪些排行,甚至没有收录。最坏的情况是K站,被纳入“黑名单”。期限若果是永久,这个域名再无出头之日,想整改也为时已晚。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线