免费 文章采集工具(小蜜蜂采集器:文章采集、图片采集利器、BBS论坛采集)
优采云 发布时间: 2021-08-29 17:07免费 文章采集工具(小蜜蜂采集器:文章采集、图片采集利器、BBS论坛采集)
小蜜蜂采集器:文章采集、pictures采集、Flash采集利器、BBS论坛采集利器
欢迎使用不受目标语言限制、不选择存储对象数据库的在线采集器。谷歌和百度在搜索中排名第一。它是完全免费的,可以放心使用。
软件应用环境:支持PHP+Mysql+ZEND Optimizer的WEB系统
当前版本:V2.1 Build 0423 发布时间:08.04.23 10:18
老版本用户升级请参考升级文件目录下的指令文件操作!!!
适用范围:
1、部署环境不限,Windows、Linux、FreeBSD、Solaris等可以安装PHP语言支持环境的系统均可使用;
2、采集 对象不限,静态HTML、动态PHP/ASP/JAVA页面均可采集;
3、采集对象支持:文章、图片、Flash;
4、Perfect 内容存储解决方案。小蜜蜂采集器提供两种存储方式:直接数据库引导和模拟提交。
1)Database Direct Guide完美支持任何基于Mysql数据库的内容管理系统存储信息,包括多表/多字段联动系统指南库,
支持直接导航规则添加自定义SQL语句,可以在引导库后实现更高级的内容结构,例如高级应用,例如在引导库后使用SQL语句重新处理特定内容。
2)simulation 提交指南库理论上支持任何目标,不受目标程序语言和数据库类别的限制;实际使用效果受目标应用影响。
每个采集模块功能介绍:
1、 文章采集module 专用于采集文章/pictures,或者采集文章附带的Flash,但功能不如Flash采集模块;
2、BBS 论坛采集module 专用采集BBS 论坛内容;
3、Flash采集模块专供采集Flash小游戏,可以完美采集缩略图,游戏介绍;
采集内容导引库介绍:采集各个模块的内容可以自由导入WEB应用系统。
功能介绍:
1、support文章内容分页采集;
2、支持论坛采集
3、支持UTF-8转GB2312,采集内容字符格式可以作为UTF-8的目标;
4、支持本地保存文章内容;
5、支持站点+栏目管理模式,让采集management一目了然;
6、支持链接替换、分页链接替换、破解一些JS/后台程序设置的反扒功能;
7、支持采集器设置无限过滤功能;
8、支持image采集本地保存,并自动替换文件名,避免重复;
9、支持FLASH文件采集本地保存,并自动替换文件名,避免重复;
10、支持限制PHP FOPEN和FSOCKET功能的虚拟主机;
11、支持手动筛选采集结果,并提供“空标题空内容”的快速过滤和删除;
12、支持Flash专业站采集,擅长采集flash小游戏,可以完美采集缩略图,游戏介绍;
13、支持全站配置规则的导入导出;
14、支持列配置规则的导入导出,并提供规则复制功能,简化设置;
15、提供引导库规则的导入导出;
16、支持自定义采集间隔时间,避免被误认为DDOS攻击而拒绝响应。 采集可以设置防止DDOS攻击网站;
17、支持自定义入仓间隔时间,避免虚拟主机并发数限制;
18、支持自定义内容写入,用户可以设置任意内容(如自己的链接、广告代码),写入采集内容:first、last或随机;导入库时会自动带上需要写入的内容,无需修改您的WEB系统模板。
19、支持采集内容替换功能,用户可以设置替换规则随意替换;
20、支持html标签过滤,让采集到达的内容只保留必要的html标签,甚至是没有任何html标签的纯文本。如果系统默认标签不能满足您的需求,您还可以自定义其他HTML标签以提高采集性能;
21、支持多种cms导库如:小蜜蜂商业门户网站系统(BBWPS)、Dedecms(织梦)、PHP168、mephpcms、 Mambo、Joomla、DuoXun(DuoXun)、SupeSite、cmsware、EmpireEcms、新宇动网(XYDW)cms、动易cms、Fengxincms、HUGESKYcms、PHPcms系统指南图书馆;
22、支持PHPWIND、Discuz、BBSxp论坛指南库;
23、支持WordPress、Bo_Blog日志系统指南库,除了官方指南库规则,您还可以设计自己的系统指南库规则,指南库设计功能完全开放;
24、自带数据库优化工具,减少采集频繁出现的过度数据碎片,降低数据库性能。
以下特殊功能仅属于“小蜜蜂采集器”:
1、支持采集进程断点续传功能,不受浏览器意外关闭影响,重启采集后不会重复;
2、支持自动比较过滤功能,已经采集的链接系统不会重复采集和存储;
以上两个功能可以大大减少采集时间,减少系统负载。
3、支持系统每天自动创建图片保存目录,方便管理;
4、支持采集/guidance间隔时间设置,避免被目标站识别为流量攻击而拒绝响应;
5、支持自定义内容写入,实现简单的反扒功能;
6、支持html标签过滤,可以近乎完美的展现你想要的采集效果;
7、Perfect 内容存储解决方案,不受目标编程语言和数据库类别限制。
以上众多强大功能免费供您使用,您可以轻松高效地安装和使用体验资料采集。
-----------------------------
选择小蜜蜂采集器的好处:
1、小蜂程序使用PHP开发,支持跨平台操作。它可以在 Windows 和 Unix 操作系统上运行。是一款高效的采集在线应用软件,完美入库。
2、小蜂不受安装位置限制。你可以在家里、你的工作电脑或网站服务器上使用它;建议直接安装在网站服务器上,体验小蜜蜂的超强功能和便捷。
3、采用服务器安装,可以直接抓取采集的图片/Flash到机器上使用;不需要像其他采集器采集一样通过FTP将数据上传到个人电脑到服务器。想象一下,如果那天你的采集图片和Flash超过100M,上传时间是什么概念。
4、采用服务器安装,可快速导入采集内容cms文章系统或BBS论坛系统;如果使用离线采集器,远程存储或上传SQL文件到存储会浪费时间。
5、小蜂独有的断点续传和重复采集过滤功能,可以节省你创作内容的时间。