www.ucaiyun.com(优采云采集器) V9.11 官方版
优采云 发布时间: 2020-08-17 19:20www.ucaiyun.com(优采云采集器) V9.11 官方版
www.ucaiyun.com是一款十分专业的数据采集软件,该软件功能强悍,为广大用户提供了网路数据采集以及信息挖掘等功能,有了它,我们可以通过灵活的形式轻松的从网页上抓取文字、图片、文件等任何数据。
程序支持远程下载图片文件,支持网站登陆后的信息获取,支持侦测文件真实地址,支持代理,支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等许*敏*感*词*特性。
【软件特色】
1、规则自定义 - 通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。
2、多任务,多线程 - 可以同时进行多个信息获取任务,每个任务可以使用多个线程。
3、所见即所得 - 任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等就会及时的反映在软件界面中。
4、数据保存 - 数据边采集边手动保存到关系数据库中,并且数据结构才能手动适应,软件可以依据采集规则手动创建数据库,以及其中的表和数组,也可以通过导库形式灵活的将数据保存到顾客已有的数据库结构中。
5、断点续采 - 信息搜集任务可以在停止后从断点开始继续采集,从此你用不再害怕你的采集任务意外中断了。
6、网站登录 - 支持网站Cookie,支持网站可视化登陆,即使登陆时须要验证码的网站也能采集。
7、计划任务 - 通过这个功能可以使你的采集任务定时、定量或则始终循环执行。
8、采集范围限制 - 可以依据采集的深度和网址的标示来限制采集的范围。
9、文件下载 - 可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地c盘或则采集结果数据库中。
10、结果替换 - 可以将采集的结果按照规则替换成你定义的内容。
11、条件保存 - 可以按照某个条件来决定这些信息保存,那些信息过滤。
12、过滤重复内容 - 软件可依据用户设置和实际情况对重复内容和重复网址手动删掉重复内容。
13、特殊链接辨识 - 运用此功能可以将用JavaScript动态生成的链接或其他更奇特的联接辨识下来。
14、数据发布 - 可以通过自定义插口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。现在已支持的目标发布媒体包括:数据库(access, sql server,my sql,oracle) ,静态htm文件。
15、预留编程插口 - 定义多个编程插口,用户可以在风波中借助PHP,C#语言进行编程,扩充采集功能。
【功能介绍】
1、支持所有网站编码:完美支持采集所有编码格式的网页,程序还可以手动辨识网页编码。
2、多种发布形式:支持目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完美结合。
3、全手动:无人值守工作,配置好程序后,程序将根据您的设置手动运行,完全无需人工干预。