秘密:网站内容采集的利与弊,你知道吗?

优采云 发布时间: 2020-09-06 13:54

  您知道网站内容采集的优缺点吗?

  昨天,Puppet写了一篇关于[学习使用工具分析网站质量的文章]的文章文章。看完这篇文章后,一位朋友提出了一个问题:“我想了解采集的弊端。”然后,Puppet将分析今天的采集问题。

  网站 采集可以简单地分为两种情况。

  一个是整个网站采集

  网站管理员希望将其他人的整个站点数据下载到自己的网站中,或将其他人的网站的某些内容保存到自己的服务器中。从内容中提取相关字段并将其发布到您自己的网站系统中。有时有必要在本地保存与Web相关的文件,例如图片和附件。

  第二种类型是网站个信息内容中的采集个

  网站管理员从Internet采集各种图片,笑话,新闻和其他信息,然后进行分类,编辑并发布到他的网站系统。 网站管理员通常通过搜索引擎搜索各种关键字以获得目标URL,然后提取网页的内容。关键字的组织决定了所获得内容的准确性和数量。由于内容来自不同的网站,因此提取内容的方法也不同。对于某种类型的信息,发布到网站系统的数据结构是相同的。

  首先,有许多这样的工具。在一般支持采集中,采集的内容通常在服务器上安装的许多网站构建器的后台中具有采集功能,例如“笑话,小说,图片”等。此外,还有一些采集工具可用于整个网站的内容,并且有很多这样的工具,例如下图所示的“ Teleport Pro”:

  

  这是Puppet对采集的简要介绍的结尾。我相信每个人都应该能够大致理解采集的含义。我不会过多地讨论该操作,让我们回到主题上来,今天我将主要讨论网站内容采集的优缺点。

  网站内容采集的好处

  一个已建立的网站,内容采集主要体现在非常方便,非常快​​地更新网站的内容,可以在短时间内迅速成为内容丰富的网站。好处确实存在。在网站页面收录上可能会非常令人印象深刻,并且关键词可能会有一些排名。但是,在木偶戏中,弊大于利。但是,除非您网站不依赖搜索引擎来获得流量,否则它也会分为几种情况。 (不建议使用Puppet,毕竟此方法是不良行为)

  网站内容采集的缺点

  1. 采集您难以控制内容的质量。

  其他网站内容可能不适合您的网站内容。不同的网站具有不同的特征。对于相同类型的网站,它不能完全相同。您完全采集该内容,甚至不知道该内容是什么,也不知道该内容是什么。举个例子:您的网站是一家装饰公司的网站,您认为您采集是另一家装饰公司的内容合适吗?即使可以过滤掉某些关键字和关键词,文章前后也会不一致,甚至内容也不会与您的网站相符。

  2. 网站质量的影响

  例如网站,搜索引擎将不会喜欢它。在初期,您的收录数量可能非常好,但是百度早就正式宣布:“针对低质量网站的措施已经生效。”每个人都将了解公告中非常重要的一段。如下图所示:

  

  因此,搜索引擎会将大量采集 网站内容直接判定为低质量站点。没有排名,甚至没有收录。最坏的情况是站点K,它收录在“黑名单”中。如果时间限制是永久性的,则该域名将不再是将来的域名,现在更正为时已晚。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线