文章采集器免费版(概括介绍守望数据采集器支持采集过程断点功能,不受直导)
优采云 发布时间: 2022-04-03 12:09文章采集器免费版(概括介绍守望数据采集器支持采集过程断点功能,不受直导)
概述
Watch Data采集器支持在进程断点采集连续采样的功能,不受浏览器误关机影响,重启后不会重复采集;支持自动比较过滤功能,具有采集的链接系统,不会重复采集和存储;以上两个功能可以大大减少采集的时间,降低系统负载。采集规则嗅探器,只需简单的鼠标复制粘贴即可生成完美的采集规则,没有繁琐的过程,即使是新手也能轻松上手采集器< @采集随便!
功能说明
1、采集目标不限,只要页面可以连接即可;
2、采集对象支持:文章、图片、Flash、视频等。
3、完美的内容存储解决方案,手网采集器提供两种存储方式:直接数据库导入和模拟提交。
1)数据库直接模式支持任何基于MySQL数据库的内容管理系统来存储信息;
2)模拟提交方式理论上支持任意目标,不受目标编程语言或数据库类别的限制;实际使用效果受目标应用影响。
功能介绍
1、支持文章内容分页采集;
2、支持论坛采集
3、支持UTF-8转GB2312,采集内容字符格式为UTF-8目标;
4、支持将文章的内容保存到本地;
5、支持站点+栏目管理模式,采集管理一目了然;
6、支持文章链接替换功能;
7、支持采集器设置无限过滤功能;
8、支持文章中的图片采集保存在本地,文件名自动替换,避免重复;
9、支持将文章中的FLASH文件采集保存到本地;
10、支持限制PHP FOPEN函数功能的虚拟主机;
11、支持采集手动过滤结果,提供“空标题、空内容”的快速过滤和删除;
12、支持PHPWIND、Discuz论坛导库,程序包收录2大论坛导库规则和操作导览说明;
13、支持自定义入库间隔,避免并发虚拟主机数限制。