优采云采集器V2.1.8.0正式版
优采云 发布时间: 2020-08-07 13:16优采云采集器是具有智能分析和可视界面的新一代智能网页采集工具,无需编程即可一键式采集,支持自动生成采集脚本,并且可以采集99%的Internet网站. 该软件简单易学,通过智能算法+可视界面,您可以抓取您想到的数据. 只要单击鼠标,就可以在网页上采集数据.
[软件功能]
一键式数据提取
易于学习,通过可视界面,只需单击鼠标即可捕获数据
快速高效
内置一组高速浏览器内核,再加上HTTP引擎模式,以实现快速数据采集
适用于各种网站
可以采集99%的Internet站点,包括单页应用程序Ajax加载和其他动态站点
[功能介绍]
向导模式
易于使用,易于通过单击鼠标自动生成
脚本定期运行
可以按计划定期运行,而无需手动
原创高速内核
自主开发的浏览器内核速度很快,远远超出了对手
智能识别
智能识别网页中的列表和表单结构(多选框下拉列表等)
广告屏蔽
自定义广告阻止模块,与AdblockPlus语法兼容,可以添加自定义规则
多个数据导出
支持Txt,Excel,MySQL,SQLServer,SQlite,Access,网站等.
[使用过程]
输入采集网址
打开软件,创建一个新任务,然后输入要采集的网站地址.
智能分析,在整个过程中自动提取数据
进入第二步后,优采云采集器会自动智能地分析网页并从中提取列表数据.
将数据导出到表,数据库,网站等
运行任务,将采集的数据导出到Csv,Excel和各种数据库,并支持api导出.
[常见问题解答]
问: 如何过滤列表中的前N个数据?
1. 有时我们需要过滤采集到的列表,例如过滤掉第一组数据(采集表时,过滤掉表的列名)
2,在列表模式菜单中单击,设置列表xpath
问: 如何捕获cookie以获取cookie并进行手动设置?
1. 首先,使用Google Chrome浏览器打开要采集的网站并登录.
2,然后按F12,将出现开发人员工具,选择“网络”
3. 然后按F5刷新下一页,然后选择一个请求.
4. 复制完成后,在优采云采集器中编辑任务,然后输入第三步以指定HTTP标头.
[更新日志]
V2.1.8.0
1. 添加插件功能
2,添加导出txt(将一个文件另存为文件)
3,多值连接器支持换行符
4. 修改数据处理的文本映射(支持搜索和替换)
5. 修复登录时的DNS问题
6. 解决图片下载问题
7. 修复json的一些问题
[下载URL]
优采云采集器V2.1.8.0正式版