BeeCollector(小蜜蜂采集器)文章采集系统 v1.725

优采云 发布时间: 2020-08-29 11:58

  BeeCollector(小蜜蜂采集器)文章采集系统 v1.725

  功能介绍:

  1、支持文章内容分页采集;

  2、支持峰会采集

  3、支持UTF-8转换到GB2312,可采集内容字符格式为UTF-8的目标;

  4、支持把文章内容保存到本地;

  5、支持站点+栏目管理方法,使采集管理一目了然;

  6、支持链接替换、分页链接替换,破解个别使用JS/后台程序设置的防采功能;

  7、支持采集器设置无限过滤功能;

  8、支持图片采集保存到本地,自动替换文件名防止重复;

  9、支持FLASH文件采集保存到本地,自动替换文件名防止重复;

  10、支持限制PHP FOPEN、FSOCKET函数功能的虚拟主机;

  11、支持采集结果人工筛选,并提供“空标题、空内容”的快速过滤删掉;

  12、支持Flash专业站采集,专门采集flash小游戏,可完美采集缩略图、游戏简介;

  13、支持全站配置规则导出、导出;

  14、支持栏目配置规则导出、导出,提供规则复制功能简化设置;

  15、提供导库规则导出、导出;

  16、支持自定义采集间隔时间,避免被误认为DDOS攻击而拒绝响应,可采集设置了防DDOS攻击的网站;

  17、支持自定义入库间隔时间,躲避虚拟主机并发数限制;

  18、支持自定义内容写入,用户可设置任意内容(如自己的链接、广告代码),写入到所采集内容的:最前面、最前面,或者随机写入;导库时手动带上须要写入的内容,无需更改您WEB系统的模版。

  19、支持采集内容替换功能,用户可设置替换规则随便替换;

  20、支持html标签过滤,允许采集到的内容仅保留必要的html标签甚至无任何html标签的纯文本;

  21、支持多种CMS导库

  程序包内含PHPCMS V2/V3、DedeCms(织梦) V2/V3、PHP168 CMS、mephpcms、Mambo CMS、Joomla CMS系统导库规则及操作指南说明;

  22、支持PHPWIND、Discuz峰会导库,程序包内含2大峰会导库规则及操作指南说明;

  23、附带数据库优化工具,减少频繁采集数据碎片过多增加数据库性能。

  以下特殊功能仅“小蜜蜂采集器”拥有:

  1、支持采集过程断点续采功能,不受浏览器意外关掉影响,重新启动后不会重复采集;

  2、支持手动对比过滤功能,对已采集的链接系统不会进行重复采集和入库;

  以上两条功能可大幅度降低采集时间,降低系统负载。

  3、支持系统每日手动创建图片保存目录,方便管理;

  4、支持采集/导库间隔时间设置,避免被目标站辨识为流量功击而拒绝响应;

  5、支持自定义内容写入,达到简单防采功能;

  6、支持html标签过滤,近乎完美的显示您想要的采集效果;

  7、完美的内容入库解决方案,不受目标程序语言、数据库类别限制。

  以上诸多强劲功能给您免费使用,即刻安装使用体验信息采集的轻松、高效。

  v1.725更新:

  1、采集功能:提升采集智能性,可采集到目标地址有0秒刷新重定向到新页面的防采目标;

  2、导库功能:增加数据库直导多表、多数组关联导库中级功能,任何基于Mysql数据库的应用系统均可使用数据库直导功能快速导库。三大采集模块同步降低本功能;

  3、修正文章采集模块采集规则设计模版错误,补充替换功能正确标签

  特别说明:安装好该版本之后,以前版本的采集规则须要编辑一次,在保留标签功能处选全部。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线