免费网页采集器(全新一代「优采云8.0」正式发布操作体验)
优采云 发布时间: 2022-03-15 00:05免费网页采集器(全新一代「优采云8.0」正式发布操作体验)
经过半年多的精心打磨,发布了新一代“优采云8.0”。
这一次,我们带来了更好的操作体验、更高的网站兼容性、更快的采集速度和更简单的UI交互。
一、8.0 重大改进
1. 更好的操作体验:全新的软件设计架构,更稳定更流畅
更稳定:所有网站采集运行稳定(彻底解决卡顿、闪退、死机等问题)
更流畅:普通交互动作(启动软件、点击制定规则、导出数据等)平均0.5秒即可完成
2. 更高的网站 兼容性:内置浏览器内核从Firefox升级到Chrome,兼容性更强
大部分与7.0不兼容的网站(如:知乎,雪球网),都兼容8.0。
3. 更快采集 速度:明显更快的“本地采集”
下面是同一个测试任务,使用本地的采集,采集100条数据。
8.0 耗时 2 分 24 秒,7.0 耗时 21 分 14 秒。在这个任务中,8.0采集 快了大约 10 倍!
注意:不同的任务有不同的采集提速效果,这是由网站本身的特性决定的。
优采云8.0 / 时长:2 分 24 秒
优采云7.0 / 时间:21分14秒
4. 更简洁的UI交互:界面更简洁,逻辑更清晰
二、备注
1. 8.0可以和7.0同时安装使用
2. 支持Windows 7及以上(暂时只支持x64位系统),XP系统或32位系统请下载版本7
3.目前云采集节点仍使用7.0内核,部分采集配置8.0的任务可能无法在云采集
三、功能已移除
1.向导模式采集(将逐渐融入自定义模式)
2.智能模式采集(将逐渐融入自定义模式)
四、未开发的功能(后续开发)
1. 将数据导出到 Oracle
2. Xpath 工具
3.幻灯片验证码识别
五、主要已知问题(后续改进)
1.8.0正则表达式“\b”与7.0所表达的意思不一致。8.0 中的“\b”不能匹配除罗马字母、十进制数字和下划线以外的字符
2. 8.0在正则工具中,“start”选项生成的正则由“\b”变为“$”,匹配结果也与7不同