利用采集器 采集的平台(优采云采集器(www.ucaiyun.com)网络数据/信息挖掘软件的功能)

优采云 发布时间: 2021-11-14 23:13

  利用采集器 采集的平台(优采云采集器(www.ucaiyun.com)网络数据/信息挖掘软件的功能)

  优采云采集器()是一款专业强大的网络数据/信息挖掘软件。通过灵活的配置,您可以轻松抓取网页、文件等资源中的文字和图片。程序支持远程下载图片文件,支持网站登录后信息采集,支持文件真实地址检测,支持代理,支持防盗链采集,支持< @采集 直接数据 模仿人入库、人工放行等诸*敏*感*词*。优采云采集器支持从任何类型的网站采集获取您需要的信息,例如各种新闻网站、论坛、电子商务网站、求职网站等,同时拥有强大的网站登录采集,多页面分页采集、网站跨层采集、POST采集、脚本页面采集、动态页面采集等高级采集 函数。强大的php和c#插件支持,让你通过二次开发,实现你想要的任何更强大的功能。

  <IMG border=0 src="/uploadfiles/2016-12-30/20161230_083851_547.jpg">

  特征:

  1.规则定制-通过采集规则的定义,您可以搜索到所有网站采集几乎任何类型的信息。

  2.Multitasking,多线程-多信息采集任务可以同时执行,每个任务可以使用多个线程。

  3.所见即所得-任务采集所见即所得的过程。过程中遍历的链接信息、采集信息、错误信息等会及时反映在软件界面中。

  4.数据保存-采集的同时数据自动保存到关系型数据库中,数据结构可以自动适配。软件可以根据采集的规则自动创建数据库,以及其中的表和字段,也可以通过数据库导航的方式灵活地将数据保存到客户现有的数据库结构中。

  5.Breakpoint Resuming-Information 采集任务停止后可以从断点继续采集,从此你再也不用担心你的采集任务被中断了不料。

  6.网站Login-support 网站Cookie,支持网站可视化登录,即使网站登录时需要验证码也可以采集。

  7.定时任务——有了这个功能,你的采集任务可以定时、定量或循环执行。

  8.采集范围限制-采集的范围可以根据采集的深度和URL的logo进行限制。

  9.文件下载-采集收到的二进制文件(如图片、音乐、软件、文档等)可以下载到本地磁盘或采集结果数据库。

  10.结果替换-您可以根据规则将采集的结果替换为您定义的内容。

  11.条件保存-可以根据一定条件决定保存和过滤哪些信息。

  12. 过滤重复内容——软件可以根据用户设置和实际情况自动删除重复内容和重复网址。

  13.特殊链接识别-使用此功能识别由JavaScript动态生成的链接或其他奇怪的链接。

  14.数据发布-您可以通过自定义接口将采集的结果数据发布到任何内容管理系统和指定的数据库。目前支持的目标发布媒体包括:数据库(access、sql server、my sql、oracle)、静态htm文件。

  15、预留编程接口-定义多个编程接口,用户可以在事件中使用PHP、C#语言进行编程,扩展采集的功能。

  更新日志:v9.3

  1.修复了在使用优采云浏览器采集cookies时,与采集器冲突导致程序退出的问题。

  2.修复任务编辑框未编辑时仍弹出保存对话框的问题。

  3. 标签组合时,支持循环获取新记录。

  4.修复列表页选项卡重启任务后“探针下载”加载失败的问题。

  5.在任务编辑中,在编辑Web和数据库发布模块时,添加对任务标签的支持。

  6.修复了采集发布时Id标签无法正确发布的问题。

  7.修复了任务完成后下载列表为空白的问题。

  8.为URL库添加压缩方案,修复URL库数据过大时任务加载慢的问题。

  9.在数据库的release模块中,现在可以支持(insert ignore)语句了

  10. 其他错误修复。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线