自动采集器怎么用(采集模块功能介绍-上海怡健医学())

优采云 发布时间: 2021-09-12 04:10

  自动采集器怎么用(采集模块功能介绍-上海怡健医学())

  适用范围:

  1、采集 对象不限,HTML、PHP、ASP、JAVA页面都没有关系;

  2、采集对象支持:文章、图片、Flash;

  3、完美的内容存储方案,小蜜蜂采集器提供2种存储方式:直接数据库引导和模拟提交。

  1)Database Direct Guide完美支持任何基于Mysql数据库的内容管理系统存储信息,包括多表/多字段联动系统指南库;

  2)simulation 提交指南库理论上支持任何目标,不受目标程序语言和数据库类别的限制;实际使用效果受目标应用影响。

  每个采集模块功能介绍:

  1、 文章采集module 专用于采集文章/pictures,或者采集文章附带的flash,但功能不如Flash采集模块;

  2、BBS 论坛采集module special采集BBS 论坛内容;

  3、Flash采集模块特别采集flash小游戏,完善采集缩略图,游戏介绍;

  采集内容导引库介绍:采集各个模块的内容可以自由导入WEB应用系统。

  功能介绍:

  1、support文章内容分页采集;

  2、支持论坛采集

  3、支持UTF-8转GB2312,采集内容字符格式可以作为UTF-8的目标;

  4、支持本地保存文章内容;

  5、支持站点+栏目管理模式,采集管理一目了然;

  6、支持链接替换、分页链接替换,破解一些JS/后台程序设置的反扒功能;

  7、支持采集器设置无限过滤功能;

  8、支持图片采集本地保存,并自动替换文件名避免重复;

  9、支持FLASH文件采集本地保存,并自动替换文件名,避免重复;

  10、支持限制PHP FOPEN和FSOCKET功能的虚拟主机;

  11、支持采集结果的手动过滤,并提供“空标题空内容”的快速过滤和删除;

  12、支持Flash专业站采集,擅长采集flash小游戏,可以完美采集缩略图,游戏介绍;

  13、支持全站配置规则的导入导出;

  14、支持列配置规则的导入导出,并提供规则复制功能,简化设置;

  15、提供引导库规则的导入导出;

  16、支持自定义采集间隔时间,避免被误认为DDOS攻击而拒绝响应。 采集可以设置防止DDOS攻击网站;

  17、支持自定义入仓间隔时间,避免虚拟主机并发数限制;

  18、支持自定义内容写入,用户可以设置任意内容(如自己的链接、广告代码),写入采集内容:第一个、最后一个或随机写入;导入库时,会自动带上需要写入的内容,无需修改您的WEB系统模板。

  19、支持采集内容替换功能,用户可以设置替换规则随意替换;

  20、支持html标签过滤,允许采集只保留必要的html标签,甚至纯文本不带任何html标签;

  21、支持多个cms导库如:PHPcms V2/V3、Dedecms(织梦) V2/V3、PHP168 cms, mephpcms, Mambo cms, Joomla cms, DuoXun (DuoXun) cms, SupeSite, cmsware, 帝国Ecms, Xinyudongwang (XYDW)cms,动易cms, Fengxuncms系统指南库;用户也可以设计适合自己系统的向导库函数。

  22、支持PHPWIND、Discuz论坛指南库,程序包中收录2个论坛指南库规则和操作说明;

  23、自带数据库优化工具,减少采集频繁出现的过度数据碎片,降低数据库性能。

  以下特殊功能仅适用于“小蜜蜂采集器”:

  1、支持采集进程断点续传功能,不受浏览器意外关闭影响,重启后不会重复采集;

  2、支持自动比较过滤功能,已经采集的链接系统不会重复采集和存储;

  以上两个功能可以大大减少采集时间,减少系统负载。

  3、支持系统每天自动创建图片存储目录,方便管理;

  4、支持设置采集/guidance间隔时间,避免被目标站识别为流量攻击而拒绝响应;

  5、支持自定义内容写入,实现简单的反扒功能;

  6、支持html标签过滤,可以近乎完美的展现你想要的采集效果;

  7、Perfect 内容存储解决方案不受目标编程语言和数据库类别的限制。

  以上众多强大功能免费供您使用,立即安装使用体验资料采集,轻松高效

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线