利用采集器 采集的平台(常见问答:XX网站能不能采集?官网视频讲解教程)

优采云 发布时间: 2021-09-03 21:12

  利用采集器 采集的平台(常见问答:XX网站能不能采集?官网视频讲解教程)

  常见问题:

  1、XX 网站你能采集吗? XX数据可以采集吗?

  在官网的视频教程中,我们已经介绍过优采云采集器是一个通用的网页采集软件。只要有网站,就可以浏览网页。你能看到的大部分内容是可以采集(视频很特殊,所以要具体情况具体分析)。

  为了保护您的隐私,您的所有任务和配置都以加密形式存储在云端。没有人,但您可以查看具体内容。你在采集过程中输入的账号密码和你的采集结果都存储在你的本地电脑上。但请严格遵守相关法律法规。如优采云采集器官方收到采集违法举报,将第一时间暂停账号。

  2、为什么采集data 过早停止?

  如果遇到采集提前停车的问题,请按照以下步骤进行自检:

  第一步:请确认浏览器能看到多少内容

  有时搜索中显示的数字与您最后看到的数字不同。请确认你能看到多少条数据,然后判断采集是提前停止还是正常停止。

  第2步:采集结果的数量与浏览器中看到的数量不一致

  在采集的过程中,如果遇到这个问题,有两种可能:

  第一种可能是采集太快,页面加载时间太慢,导致采集无法访问页面中的数据。

  在这种情况下,请增加请求的等待时间。等待时间变长之后,网页就会有足够的时间加载内容。

  请求等待时间的设置在启动设置->智能策略中,如下图:

  第二种可能是你遇到了其他问题

  在操作过程中,我们可以在操作界面点击“查看网页”,观察当前网页内容是否正常,是否无法正常显示,是否有异常提示等

  如果出现上述情况,我们可以降低采集的速度,切换代理IP,手动编码等,至于哪种方法可以工作,这个需要测试一下才知道不同的网站问题是不同的。没有一种统一的解决方案。

  如果您在尝试上述解决方案后仍然无法解决问题,您可以在帮助中心给我们反馈,我们将为您提供支持。

  3、为什么采集不见了?

  不完整的字段一般有以下两种情况:

  首先,由于列表元素的结构不同,有些元素有其他元素没有的字段。这是正常现象。请在网页上确认相应元素中是否存在您想要的字段。

  其次,页面结构发生了变化。这通常发生在收录多个页面结构的同一个搜索结果中,例如搜索引擎搜索结果(包括多种网站)。

  这种情况需要具体问题具体分析。您可以将您的采集任务导出并发送到我们的官方帮助中心,我们的客服会帮您测试分析。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线