采集目标不限,无所谓HTML、PHP、ASP、JAVA页面

优采云 发布时间: 2021-03-29 06:18

  采集目标不限,无所谓HTML、PHP、ASP、JAVA页面

  适用范围:

  1、 采集目标不受限制,与HTML,PHP,ASP,JAVA页面无关;

  2、 采集对象支持:文章,图片,Flash;

  3、完美的内容存储解决方案,Little Bee 采集器提供了2种存储方法:直接数据库指导和模拟提交。

  1)数据库直接指南完全支持任何基于Mysql数据库的内容管理系统来存储信息,包括多表/多字段链接系统指南库;

  2)仿真提交指南库在理论上支持任何目标,并且不受目标程序语言或数据库类别的限制;实际使用效果受目标应用程序的影响。

  每个采集模块的功能简介:

  1、 文章 采集模块专用于采集 文章 /图片,它也可以是附加到采集 文章的闪光灯,但功能不如Flash强大采集模块;

  2、 BBS论坛采集模块,专门用于采集 BBS论坛内容;

  3、 Flash 采集模块专门研究采集 Flash游戏,非常适合采集缩略图和游戏介绍;

  采集内容指南库简介:每个模块采集的内容都可以自由导入到WEB应用程序系统中。

  功能介绍:

  1、支持文章内容分页采集;

  2、支持论坛采集

  3、支持将UTF-8转换为GB2312,并且采集内容字符格式可以作为UTF-8的目标;

  4、支持在本地保存文章的内容;

  5、支持站点+列管理,因此采集管理一目了然;

  6、支持链接替换,分页链接替换,并破解了JS /后台程序设置的一些反选功能;

  7、支持采集器设置无限过滤功能;

  8、支持在本地保存图片采集,自动替换文件名以避免重复;

  9、支持将FLASH文件采集保存在本地,并自动替换文件名以避免重复;

  1 0、支持限制PHP FOPEN和FSOCKET功能的虚拟主机;

  1 1、支持采集手动筛选结果,并提供“空标题,空内容”的快速过滤和删除功能;

  1 2、支持Flash专业网站采集,专门开发采集 Flash游戏,可以完善采集缩略图和游戏介绍;

  1 3、支持导入和导出站点范围的配置规则;

  1 4、支持导入和导出列配置规则,并提供规则复制功能以简化设置;

  1 5、提供指南库规则的导入和导出;

  1 6、支持自定义采集间隔时间,以避免被误认为DDOS攻击和拒绝响应。可以设置采集来防止DDOS攻击网站;

  1 7、支持自定义的仓储间隔时间,避免了虚拟主机并发数量的限制;

  1 8、支持自定义内容写入,用户可以设置任何内容(例如自己的链接,广告代码),并写入采集的内容:第一个,最后一个或随机写入;导入库时,它将自动带来需要编写的内容,而无需修改WEB系统的模板。

  1 9、支持采集内容替换功能,用户可以设置替换规则以随意替换;

  2 0、支持html标签过滤,允许采集仅保留必要的html标签,甚至保留纯文本,而没有任何html标签;

  2 1、支持多个cms导航库,例如:PHP cms V2 / V 3、 Dede cms(织梦)V2 / V 3、 PHP168 cms,mephp cms,Mambo cms,Joomla cms,DuoXun(DuoXun)cms,SupeSite,cms ware,Empire E cms,(XYDW)cms,Dongyi cms,Fengxun cms系统指南库;用户还可以设计适合自己系统的指南库功能。

  2 2、支持PHPWIND,Discuz论坛指南库,该程序包收录2个论坛指南库规则和操作说明;

  2 3、随附数据库优化工具,以减少频繁出现的采集过多数据碎片并降低数据库性能。

  以下特殊功能仅适用于“小蜜蜂采集器”:

  1、支持采集进程断点恢复功能,该功能不受浏览器意外关闭的影响,并且在重新启动采集之后将不再重复;

  2、支持自动比较和过滤功能,不会重复采集和存储在采集的链接系统中;

  以上两个功能可以大大减少采集时间并减少系统负载。

  3、支持系统每天自动创建图片保存目录,方便管理;

  4、支持设置采集 /引导间隔时间,以避免被目标站点识别为交通攻击和拒绝响应;

  5、支持自定义内容编写,以实现简单的防摘功能;

  6、支持html标签过滤,几乎完美显示所需的采集效果;

  7、内容存储的完美解决方案,不受目标编程语言和数据库类别的限制。

  上述许多强大功能免费供您使用,立即安装和使用体验信息采集简单高效

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线