算法 自动采集列表(优采云中该如何实现翻页?循环点击下一页的步骤 )

优采云 发布时间: 2021-09-18 15:03

  算法 自动采集列表(优采云中该如何实现翻页?循环点击下一页的步骤

)

  单击页面上的[下一步]按钮翻页,这是最常见的翻页方式。这是网站是:/information/Info/news/news.shtml

  

  将鼠标放在图片上,右键单击并选择[在新选项卡中打开图片]以查看大型高清图片

  下面的其他图片也是如此

  如何在优采云中翻页?以下是具体操作步骤

  步骤一、首先创建一个任务

  在学习了前面的课程之后,我们学习了如何在单个页面上采集list、form和单击链接来输入详细数据。根据需要,先配置一个采集1页面数据任务

  这里,我以采集list数据为例。首先,创建一个[循环-提取数据]步骤

  

  现在第1页上的列表数据是采集down。接下来,我们要使优采云自动翻页,并从第2页、第3页采集数据。。。到最后一页。这需要建立一个翻页周期

  步骤二、建立翻页循环

  在页面中找到并点击【下一页】按钮,在自动弹出的【*敏*感*词*操作提示框】中点击【循环点击下一页】。这样,使用[下一步]按钮创建[循环翻页]的步骤就完成了。您可以在流程图中看到翻页周期步骤,这表明我们已经成功创建了翻页周期,优采云可以自动完成翻页

  为什么反复点击下一页?就是让优采云反复点击【下一页】翻页,从而实现采集第二页、第三页。。。直到数据的最后一页。这与单击[下一步]按钮在浏览器中翻页的逻辑相同

  

  特别说明:

  a。如果不是在一个周期中单击下一页,而是在一个周期中单击单个XXX,会怎么样?【反复点击下一页】的实质是反复点击页面上的按钮翻页。用于在不同网页上翻页的按钮可能以不同的方式显示。常见的有:下一页[>][下一页>]。对应的优采云操作提示框可能是[循环点击下一页][循环点击单个链接][循环点击单个元素][循环点击单个图片]。它们基本相同,用于创建循环翻页

  

  步骤三、开始采集

  1、单击保存并启动,然后选择启动本地采集. 启动后,优采云start全自动采集data。(本地采集为采集使用自己的计算机,云采集使用优采云提供的云服务器采集获取详细信息)

  

  2、采集完成后,选择适当的导出方法导出数据。支持导出到excel、CSV和HTML。在此处导出为excel

  

  样本数据:

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线