优采云采集器特色功能智能识别数据,小白神器(组图)
优采云 发布时间: 2021-08-20 20:04优采云采集器特色功能智能识别数据,小白神器(组图)
优采云采集器是一款专业的网络数据采集软件。它由前谷歌技术团队创建,拥有非常强大的人工智能技术。只需输入网址即可帮助用户轻松采集各类网页数据信息,并支持导出采集结果。 优采云采集器也是免费的,适用于各行各业,有需要的用户请下载。
优采云采集器功能
智能识别数据,小白神器
智能模式:基于人工智能算法,只需输入网址,即可智能识别列表数据、表格数据、分页按钮。无需配置任何采集规则,一键采集。
自动识别:列表、表格、链接、图片、价格等
可视化点击,轻松上手
流程图模式:只需根据软件提示点击页面,完全符合人们浏览网页的思维方式,简单几步即可生成复杂的采集规则,结合智能识别算法,任何网页上的数据都可以轻松采集。
可以模拟操作:输入文字、点击、移动鼠标、下拉框、滚动页面、等待加载、循环操作和判断条件等
支持多种数据导出方式
采集结果可以本地导出,支持TXT、EXCEL、CSV和HTML文件格式,也可以直接发布到数据库(MySQL、MongoDB、SQL Server、PostgreSQL)供您使用。
功能强大,提供企业级服务
优采云采集器提供了丰富的采集功能,无论是采集stability还是采集efficiency,都能满足个人、团队和企业采集的需求。
功能丰富:定时采集、自动导出、文件下载、加速引擎、分组启动导出、Webhook、RESTful API、SKU和大图智能识别等
云账号,方便快捷
创建优采云采集器账号并登录,你所有的采集任务设置都会自动加密保存到优采云的云服务器。不用担心采集任务丢失,任务运行和采集数据在你本地,非常安全。只有在本地登录客户端后才能查看。 优采云采集器 对账户没有终端绑定限制。切换终端时采集任务也会同步更新,任务管理方便快捷。
优采云采集器操作流程
1、输入正确的网址
输入正确的网址后,这个采集任务成功了一半。
优采云采集器支持单网址和多网址采集,支持从本地TXT文件导入网址,也支持批量生成参数网址。
2、选择页面类型并设置分页
智能模式下优采云采集器会自动识别网页。如果识别不准确,可以先手动自动识别。如果手动自动识别无效,可以手动点击选择列表,帮助软件识别正确结果。
3、pre-login
在编辑任务的过程中,我们有时会遇到需要登录才能查看内容的网页。这时候就需要用到预登录功能了。登录成功后可以正常进行数据采集。
4、预执行操作
在编辑任务过程中,如果用户需要进行点击操作,可以使用预先执行的操作来满足用户需求。
5、输入验证码
在编辑任务中,如果用户遇到验证码,可以点击右上角的验证码输入功能手动输入。
6、切换代理
在编辑任务中,如果用户遇到页面无法显示或提示验证码,也可以点击右上角的切换代理功能进行操作。
7、网络安全设置
用户在编辑任务过程中,遇到异常网页可以尝试使用该功能,但要注意开启该选项可能会导致页面上的某些内容被采集(如iframe)。
8、切换浏览器模式
在编辑任务过程中,可以使用不同的浏览器模式对采集效果进行优化,具体使用场景需要根据实际情况判断。
9、设置提取字段
在智能模式下,软件会自动识别网页中的数据并显示在采集result预览窗口中,用户可以根据需要设置字段。
10、depth采集
如果用户需要采集detail页面的信息,可以点击左上角的deep采集按钮,或者直接点击链接打开详情页面,采集detail页面数据。
11、设置数据过滤器/采集range
在编辑任务的过程中,如果用户需要设置一些过滤条件或者设置采集范围,可以点击页面上的相应按钮进行功能设置。
12、采集任务设置
在启动采集任务之前,我们需要对采集任务进行配置,包括定时启动、智能策略、自动导出、文件下载、加速引擎、重复数据删除和开发者设置。
13、运营数据接口
启动任务后会跳转到数据运行界面,用户可以看到数据采集的情况。
14、查看采集结果并导出数据
采集任务结束后,用户可以查看采集结果并导出数据。