小蜜蜂格式数据采集系统与普通文章采集的区别?
优采云 发布时间: 2021-07-10 23:17小蜜蜂格式数据采集系统是一个高度智能的采集系统,完全面向用户采集行为,允许用户自行设计采集内容;适用于采集格式数据,如:房产、招聘、招投标、互联网商业情况、产品价格、股票/期货价格等信息。
类似软件
版本说明
软件地址
格式数据定义:一条信息收录多个子项,每个子项的内容分别显示;例如,一条租房信息可能包括以下基本子项,包括:位置、位置、面积、房屋类型、楼层、面积、价格、方向、产权、设施、价格、联系人、手机、电话, 电子邮件......;
格式数据采集和普通文章采集的区别:
文章采集一般只设计采集标题、文章内容、出处、作者、发布日期,不能扩展;并且文章的内容是连贯的显示,而格式数据的内容更多这些子项是独立显示的,传统的文章采集系统采集无法访问real等特殊信息房地产、招聘、投标、在线业务条件、产品价格和股票/期货价格。
运行环境:WEB系统支持PHP+Mysql+ZEND优化器
功能介绍:
1、允许用户在系统基础采集标签的基础上,随时自定义采集标签(试用版和标准版可自定义20个标签,高级版不限) ;
2、site+频道管理模式,采集管理一目了然;
3、支持login采集,但采集部分login只能浏览目标信息源;
4、允许设置自定义标签内容属性,采集时会自动检查内容属性,决定是否保留在库中;
5、支持采集手动筛选结果,并提供“空标题、空内容”的快速过滤和删除;
6、支持站点配置规则的导入导出;
7、支持通道配置规则的导入导出,并提供规则复制功能,简化设置;
8、支持采集进程断点续传功能,不受浏览器意外关闭影响,重启后不会重复采集;
9、支持自动比较过滤功能,已经采集的链接不会重复采集和存储;
10、PHP程序开发,支持多种操作系统环境,Windows、FreeBSD、Linux、Solaris均可安装部署;
11、支持远程部署,产品可以安装在服务器上(推荐)运行,也可以安装在本地电脑上运行;
12、server 在线部署采集可以利用本产品的节能高效特性; 采集data可以快速导入WEB应用系统,是普通离线采集工具无法比拟的;
13、多种数据导出方式,可将采集数据导入WEB系统;
14、支持本系统采集的二次开发和数据提取;
15、试用版可以测试采集功能,数据不能导出库,其他功能不限。