最新采集器(php和c#插件支持,让您通过二次开发实现任何更强大的功能)
优采云 发布时间: 2021-11-17 10:16最新采集器(php和c#插件支持,让您通过二次开发实现任何更强大的功能)
优采云采集器是一款专业强大的网络数据/信息挖掘软件。通过灵活的配置,您可以轻松地从网页中抓取文本、图片、文件等资源。程序支持远程下载图片文件,支持网站登录后信息采集,支持文件真实地址检测,支持代理,支持防盗链采集,支持< @采集 直接数据 模仿人入库、人工放行等诸*敏*感*词*。
支持从任何类型的网站采集获取您需要的信息,例如各种新闻网站、论坛、电子商务网站、招聘< @网站等同时具有强大的网站登录采集、多页面分页采集、网站跨层采集 、POST采集、脚本页面采集、动态页面采集等高级采集功能。强大的php和c#插件支持,让你通过二次开发,实现你想要的任何更强大的功能。
【特征】
1、规则定制-通过采集规则的定义,您可以搜索到所有网站采集几乎任何类型的信息。
2、Multitasking,多线程——可以同时执行多个信息获取任务,每个任务可以使用多个线程。
3、所见即所得-任务采集所见即所得的过程。过程中遍历的链接信息、采集信息、错误信息等会及时反映在软件界面中。
4、数据保存-采集的同时数据自动保存到关系型数据库,数据结构可以自动适配。软件可以根据采集的规则自动创建数据库,以及其中的表和字段,也可以通过数据库导航的方式灵活地将数据保存到客户现有的数据库结构中。
5、断点恢复采集-信息采集任务可以在停止后从断点恢复采集,从此不用担心你的采集任务被意外中断.
6、网站Login-support 网站Cookie,支持网站可视化登录,即使网站登录时需要验证码也可以采集。
7、定时任务——有了这个功能,你的采集任务可以定时、定量或循环执行。
8、采集范围限制-采集的范围可以根据采集的深度和URL的logo进行限制。
9、文件下载-采集接收到的二进制文件(如图片、音乐、软件、文档等)可以下载到本地磁盘或采集结果数据库。
10、结果替换-您可以根据规则将采集的结果替换为您定义的内容。
11、条件保存-可以根据一定条件决定保存和过滤哪些信息。
12、 过滤重复内容——软件可以根据用户设置和实际情况自动删除重复内容和重复网址。
13、特殊链接识别-使用此功能识别由JavaScript动态生成的链接或其他奇怪的链接。
14、数据发布-您可以通过自定义接口将采集的结果数据发布到任何内容管理系统和指定的数据库。目前支持的目标发布媒体包括:数据库(access、sql server、my sql、oracle)、静态htm文件。
15、预留编程接口-定义多个编程接口,用户可以在事件中使用PHP、C#进行编程,扩展采集的功能。
【软件特色】
1、强大的通用性
无论新闻、论坛、视频、黄页、图片、下载网站,只要是浏览器可以看到的结构化内容,通过指定匹配规则,就可以采集获取内容你需要 。
2、稳定高效
历经五年磨一剑,软件不断更新完善,采集速度快,性能稳定,占用资源少。
3、可扩展性强,应用范围广
自定义网页发布,主流数据库自定义存储发布,自定义本地php和.net外部编程接口处理数据,让数据为你所用。
【更新日志】
V9.9.0
1、优化效率,修复运行大量任务时卡住的问题
2、修复大量代理时配置文件被锁定,程序退出的问题
3、修复某些情况下无法连接MySQL的问题
4、其他界面和功能优化