全新智能网页数据采集软件-优采云-2.exe运行
优采云 发布时间: 2021-03-22 02:05全新智能网页数据采集软件-优采云-2.exe运行
优采云 采集器是一种全新的智能Web数据采集软件,可以帮助用户轻松单击采集 Web数据。 采集完成后,您还可以将数据发送到本地文件并发布到网站和数据库等,支持批处理自动采集,该软件易于使用,整个过程是问答式的回答引导式操作,即使从未使用过它的朋友也可以轻松完成它,需要它的朋友也不要错过它!
安装教程
1、在此站点下载并解压缩,双击houyicaiji-Setup- 2. 0. 3. exe运行,单击“我接受”
2、选择安装路径,单击安装
3、正在安装,请稍候
4、安装完成,点击运行
功能
直观地单击并选择,然后单击采集网页数据
拖动并单击整个过程,无需开发或了解技术。任何人都可以使用网络数据采集器
采集和导出都是免费的,可以放心使用,不受限制
所有免费的采集软件,无限制导出数据的数据都可以导出到本地文件,发布到网站和数据库等。
它可以在后台运行,并且速度可以实时显示。
您可以将软件切换为在后台运行,而不会打扰您的其他前台工作。浮动窗口可以实时查看采集速度和采集数据。
所有平台都可以使用Win / Mac / Linux
优采云与其他采集器不同,它支持所有操作系统版本更新和功能升级,以同步所有平台。
使用过程
1、可视化自定义采集流程
问答指导,视觉操作和自定义采集过程的整个过程。
自动记录和模拟网页操作顺序
高级设置可以满足更多采集需求
2、点击提取网页数据
鼠标单击以选择要爬网的网页内容,操作简单。
您可以选择提取文本,链接,属性,html标记等。
3、运行批处理采集数据
该软件会根据采集流程和提取规则自动对采集进行批处理
采集速度和过程的快速,稳定,实时显示可以将软件切换为在后台运行,而不会影响前台的工作。
4、导出并发布采集的数据
采集的数据会自动制成表格,并且可以自由配置字段。
支持将数据导出到Excel等本地文件,以及一键发布到cms 网站 / database / WeChat官方帐户等媒体。
使用方法第1步:创建采集任务来自定义采集百度搜索结果数据的方法
1)启动优采云 采集器,进入主界面,选择自定义采集,然后单击创建任务按钮以创建“自定义采集任务”
2)输入百度搜索的网址,包括三种方式
1、手动输入:直接在输入框中输入URL,并且多个URL需要用换行符分隔
2、单击以读取文件:用户选择一个文件来存储URL。文件中可以有多个URL地址,并且这些地址需要用换行符分隔。
3、批量添加方法:通过添加和调整地址参数来生成多个常规地址
第2步:自定义采集流程
1)单击创建后,它将自动打开第一个URL进入自定义设置页面。默认情况下,已经创建了开始,打开网页和结束的过程块。底部的模板区域用于拖放到画布上以生成一个新的处理块。单击打开的网页中的属性按钮以修改打开的URL
2)添加文本输入处理块:将输入文本块从底部的模板区域拖动到打开的网页块的背面。当出现阴影区域时,您可以松开鼠标,这时它会自动连接,添加完成
3)生成完整的流程图:在上面添加文本输入过程块的拖放过程之后,添加新块,如下图所示:
关键步骤块设置简介
第2步:定时等待用于等待先前打开的网页的完成
第3步:单击输入框的Xpath属性按钮,单击属性菜单中的图标以选择网页上的输入框,单击输入文本属性按钮,然后在菜单中输入要搜索的文本
步骤4:用于设置单击开始搜索按钮,单击元素的xpath属性按钮,单击菜单中的单击图标,然后单击网页上的百度按钮。
步骤5:用于设置加载下一个列表页面的周期。在循环块内部的循环条件块中设置详细条件。单击此处的操作按钮以选择单个元素,然后在属性菜单中单击该元素的xpath属性按钮,然后单击上述网页中的下一页按钮。周期时间属性按钮可以默认为0,即,对下一页的点击次数没有限制。
步骤6:用于在循环提取列表页面中设置数据。在循环块内的循环条件块中设置详细条件,单击此处的操作按钮,选择未固定的元素列表,然后在属性菜单中单击该元素的xpath属性按钮,然后在网页中单击两次以提取第一块和第二个元素。周期时间属性按钮可以默认为0,即列表中采集的字段数不受限制。
第7步:用于执行以下操作:单击下一页按钮,单击元素xpath属性按钮,然后选择当前循环中元素的xpath选项。
第8步:用于设置网页加载的等待时间。
步骤9:用于设置要在列表页面上提取的字段规则,单击属性按钮中循环按钮中的“使用”元素,然后选择在循环中使用该元素的选项。单击元素模板属性按钮以添加和减去字段表中的字段以添加和删除字段。要添加字段,请使用单击操作,即单击加号,然后将鼠标移至网页元素,然后单击以进行选择。
4)点击开始采集以开始采集
第3步:数据采集和导出
1) 采集任务正在运行
2) 采集完成后,选择“导出数据”以将所有数据导出到本地文件
3)选择“导出方法”以导出采集的良好数据,在这里您可以选择excel作为导出格式
4) 采集如下所示导出数据后