采集器(优采云采集器(www.ucaiyun.com)的数据采集软件介绍及特色介绍)
优采云 发布时间: 2022-01-10 06:13采集器(优采云采集器(www.ucaiyun.com)的数据采集软件介绍及特色介绍)
优采云采集器()是一款功能强大的数据采集软件,可以轻松抓取文字、图片、文件等资源。软件还支持图片文件远程下载、文件真实地址检测、防盗链采集和采集数据直接存储、模仿者手动发布等。
软件功能
1、通用
不管新闻、论坛、视频、黄页、图片、下载网站,只要是可以通过浏览器看到的结构化内容,通过指定匹配规则,就可以采集得到你想要的内容需要 。
2、稳定高效
五年磨一剑,软件不断更新完善,采集速度快,性能稳定,占用资源少。
3、扩展性强,应用广泛
自定义web发布,自定义主流数据库的保存和发布,自定义本地php和.net对外编程接口处理数据,让数据为你所用。
基本技能
1、规则自定义 - 使用 采集 规则定义,几乎可以搜索所有 网站采集 任何类型的信息。
2、多任务,多线程——可以同时执行多个信息获取任务,每个任务可以使用多个线程。
3、所见即所得——所见即所得,在任务采集过程中得到。过程中遍历的链接信息、采集信息、错误信息等都会及时反映在软件界面中。
4、数据存储——数据在采集的同时自动保存到关系数据库,数据结构可以自动适配,软件可以根据采集规则自动创建数据库,其中的表和字段,数据也可以通过数据库导入的方式灵活的保存到客户现有的数据库结构中。
5、Breakpoint Continuation - 信息采集任务在停止后可以从断点继续采集,因此您不再需要担心您的采集 任务被意外中断。
6、网站登录——支持网站cookies,支持网站可视化登录,甚至登录时需要验证码的网站也可以采集。
7、Scheduled Tasks - 此功能允许您的 采集 任务定期、定量或循环执行。
8、采集范围限制 - 采集 的范围可以根据 采集 的深度和 URL 的身份来限制。
9、文件下载 - 您可以将 采集 二进制文件(例如图片、音乐、软件、文档等)下载到本地磁盘或 采集结果数据库。
10、结果替换——可以根据规则将采集的结果替换为你定义的内容。
变更日志
2021-03-15
优采云采集器V9.版本 30
1、优化了标签数据处理中的字符替换。
2、优化了无效文件检测导致文件下载失败的问题。
3、处理用户名收录特殊符号无法登录的问题。
4、修复数据管理批量操作数据有异常弹出提示的问题。
5、修复了二级代理卡住的问题。
6、改进了无法自动获取cookies的问题。
7、发布到word,自动将""转义为""、"""。
8、已修复:勾选发布选项,采集最大数量无效。
9、修复 oracle 链接问题。
10、支持oss存储。
11、修复:下载地址后面有斜线,下载文件时没有后缀。