2020/4/29图片同理采集结果采集教程说明

优采云 发布时间: 2021-07-22 02:28

  

2020/4/29图片同理采集结果采集教程说明

  

  鼠标移到图片上,右击选择【在新标签页中打开图片】查看高清大图

  同样适用于下面的其他图片

  采集Result

  采集 结果可以导出为Excel、CSV、HTML、数据库等格式。导出到 Excel 示例:

  

  教程说明

  本文制作时间:2020/4/29优采云版本:V8.1.8

  如因网页改版导致网址或步骤无效,无法采集到目标数据,请联系官方客服,我们会及时更正。

  采集steps

  第一步:打开网页

  步骤二、创建[循环列表],采集所有文章列表中的数据

  步骤三、点击进入文章详情,采集文章text

  步骤四、编辑字段

  步骤五、设置页面滚动

  步骤六、Start采集

  具体步骤如下:

  步骤一、打开网页

  在首页【输入框】输入目标网址#mid=52255723016,点击【开始采集】,优采云会自动打开网页。

  

  特别说明:

  一个。打开网页后,如果开始启动【自动识别】,请点击【不再自动识别】或【取消识别】将其关闭。因为本文不适合使用【自动识别】。

  B. 【自动识别】适用于自动识别网页列表、滚动、翻页。识别成功后,直接启动采集获取数据。点击查看详情

  c.您可以根据需要更改标题号码的网址。

  步骤二、创建[循环列表],采集所有文章列表中的数据

  完成以下 4 个连续步骤:

  1、在页面上选择1个文章list(注意必须选择整个列表,包括所有必填字段)

  2、在*敏*感*词*操作提示框中,点击【选择子元素】

  3、点击【全选】

  4、click【采集data】

  

  特别说明:

  一个。经过以上4个连续的步骤,就完成了【Cycle-Extract Data】的创建。 [Loop]中的item对应页面上所有文章列表,[Extract Data]中的字段对应每个文章列表中的字段。 采集启动后,优采云会按照循环中的顺序依次提取每个列表中的字段。

  B.为什么我们可以通过以上4个步骤建立一个【循环提取数据】?点击查看详情

  步骤三、点击文章链接进入详情页,采集文字和图片

  1、点击文章链接进入详情页

  在当前文章列表中(网页红框框内),选择文章标题,在操作提示框中点击【点击链接】,然后自动输入文章详细信息页面。

  

  特别说明:

  一个。一定要选中当前文章列表中的文章链接并做【点击链接】,否则【点击元素】步骤无法与【循环】中的文章列表链接,会一直保留重复点击 对于某个文章链接,进入其文章详情页,不可能依次点击每个文章链接。

  B.如何找到当前的文章 列表?在【循环列表】中查看当前项目(蓝色背景),然后点击【提取列表数据】,网页上的红框为当前文章列表。

  

  2、采集文章详情页中的字段

  选择页面上的文字,然后在操作提示框中点击【采集this element text】。

  文本字段可以通过这种方式提取。在示例中,我们提取了文章title、作者、发表时间、正文等字段。

  

  特别说明:

  一个。文字、图片、视频、源代码是不同的数据形式,在操作提示框中选择提取方式时略有不同。文字一般为【采集此元素文字】,图片一般为【采集此图片地址】。更多提取方法请点击查看

  3、创建【循环列表】提取文中所有图片地址

  一个文章中可能有多张图片,通过以下步骤,将采集文章地址中的所有图片:

  ①选择图片

  ②在*敏*感*词*的操作提示框中,选择【全选】

  ③选择【采集下图地址】

  

  特别说明:

  一个。经过以上连续三个步骤,就完成了【Cycle-Extract Data】的创建。 [Cycle]中的项目对应页面上的所有图片,[Extract Data]中的字段对应每张图片的图片地址。 采集启动后,优采云会在循环中依次提取每个图片地址。

  B.为什么我们可以通过以上3步设置【循环提取数据】?点击查看

  步骤四、编辑字段

  进入【提取数据】设置页面,可以删除冗余字段、修改字段名称、移动字段顺序等

  

  步骤五、设置页面滚动

  打开今日头条网页后,向下滚动页面以加载更多文章列表,也需要在优采云中滚动设置。

  进入【打开网页】设置页面,点击【页面加载后】,设置【页面加载后向下滚动】,滚动方式为【向下滚动一屏】,【滚动次数】为10次, [每个间隔] 0.5 秒并保存。

  

  特别说明:

  一个。设置中的滚动次数和时间间隔,请根据采集要求和网页加载条件进行设置,它们不是静态的,详情请点击查看处理滚动加载数据的网页教程

  步骤六、Start采集

  1、 点击【采集】和【启动本地采集】。启动优采云后自动采集数据。

  

  特别说明:

  一个。 【本地采集】为采集使用自己的电脑,【云采集】使用优采云采集提供的云服务器,点击查看本地采集与云采集详细解释。

  2、采集 完成后,选择合适的导出方式导出数据。支持导出到 Excel、CSV、HTML、数据库等。这里导出到 Excel。数据示例:

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线