免费网页采集器(优采云采集器软件特色介绍及解决方法步骤介绍-苏州安嘉 )

优采云 发布时间: 2021-09-27 22:06

  免费网页采集器(优采云采集器软件特色介绍及解决方法步骤介绍-苏州安嘉

)

  优采云采集器是一款专业的网页数据采集软件,可以一键使用采集网页数据功能,任何人都可以使用,可视化,无需开发,无需导出数据限制,支持后台操作,速度实时显示,非常方便。优采云采集器软件特点

  1、运行批处理采集数据

  软件根据采集的处理和提取规则自动对采集进行批量处理;

  快速稳定,实时显示采集速度和进程;

  软件可切换后台运行,不打扰前台工作。

  2、导出发布采集的数据

  采集 数据自动制表,字段可自由配置;

  支持数据导出到Excel等本地文件;

  并一键发布到cms网站/database/微信公众号等媒体。

  优采云采集器 使用说明

  如何自定义采集百度搜索结果数据

  第一步:创建采集任务

  1)启动优采云采集器,进入主界面,选择自定义采集,点击创建任务按钮,创建“自定义采集任务”

  2)输入百度搜索的网址,三种方式

  1、 手动输入:直接在输入框中输入网址,多个网址需要用换行符分隔。

  2、 点击读取文件:用户选择一个文件来存储 URL。文件中可以有多个 URL 地址,地址之间需要用换行符分隔。

  3、 批量添加方式:通过添加和调整地址参数生成多个常规地址。

  第二步:自定义采集流程

  1) 点击创建后,会自动打开第一个网址,进入自定义设置页面。默认情况下,已经创建了开始、打开网页和结束的进程块。底部的模板区域用于拖放到画布上生成新的流程块;点击打开网页中的属性按钮,修改打开的网址。

  2)添加文本输入流程块:将底部模板区域中的输入文本块拖到打开的网页块的后面。出现阴影区域时,松开鼠标,此时会自动连接,添加完成。

  3) 生成一个完整的流程图: 按照上面添加输入文本流程块的拖放流程添加一个新块:如下图所示:

  

  关键步骤块设置介绍

  第二步:定时等待用于等待之前打开的网页完成。

  第三步:点击输入框的Xpath属性按钮,点击属性菜单中的图标选择网页上的输入框,点击输入文本属性按钮,在菜单中输入要搜索的文本。

  第四步:设置,点击开始搜索按钮,点击元素的xpath属性按钮,点击菜单中的点击图标,然后点击网页上的百度按钮确定。

  第五步:用于设置加载下一个列表页面的周期。在循环块内的循环条件块中设置详细条件。单击此处的操作按钮选择单个元素,然后在属性菜单中单击该元素的xpath 属性按钮,然后在网页中单击下一页按钮,如上。循环次数属性按钮可以默认为0,即下一页没有点击次数限制。

  第六步:用于设置列表页数据的循环抽取。在循环块内部的循环条件块中设置详细条件,点击这里的操作按钮,选择未固定元素列表,然后在属性菜单中点击该元素的xpath属性按钮,然后在网页中点击两次即可提取第一个块和第二个元素。循环次数属性按钮可以默认为0,即不限制列表中采集的字段数。

  Step 7:用于执行点击下一页按钮、点击元素xpath属性按钮、选择当前循环中元素的xpath选项的操作。

  第八步:同样用于设置网页加载的等待时间。

  第九步:用于在列表页面设置要提取的字段规则,点击属性按钮中的循环中使用元素按钮,选择循环中使用元素的选项。单击元素模板属性按钮在字段表中添加和减去字段以添加和删除字段。添加字段使用点击操作,即点击加号,然后将鼠标移动到网页元素上,点击选择。

  4)点击开始采集,开始采集

  

  第三步:数据采集并导出

  1)采集 任务正在运行

  

  2)采集 完成后,选择Export Data,将所有数据导出到本地文件。

  3)选择导出方式,导出采集的好数据。在这里您可以选择excel作为导出格式。

  界面预览:

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线