免费采集器(概括介绍守望数据采集器支持采集过程断点功能,不受直导)
优采云 发布时间: 2022-02-20 03:22免费采集器(概括介绍守望数据采集器支持采集过程断点功能,不受直导)
概述
观察数据采集器支持进程断点连续采样采集功能,不受浏览器误关机影响,重启后不再重复采集;支持自动比较过滤功能,不受浏览器误关机影响。采集采集的链接系统不会重复采集和存储;以上两个功能可以大大减少采集的时间,降低系统负载。采集规则嗅探器,只需要简单的鼠标复制粘贴即可生成完美的采集规则,没有繁琐的过程,即使是新手也能轻松上手采集器< @采集随便!
功能说明
1、采集目标不限,只要页面可以连接即可;
2、采集对象支持:文章、图片、Flash、视频等。
3、完美的内容存储解决方案,手网采集器提供两种存储方式:直接数据库导入和模拟提交。
1)数据库直接模式支持任何基于MySQL数据库的内容管理系统来存储信息;
2)模拟提交方式理论上支持任意目标,不受目标编程语言和数据库类别的限制;实际使用效果受目标应用影响。
功能介绍
1、支持文章内容分页采集;
2、支持论坛采集
3、支持UTF-8转GB2312,采集内容字符格式为UTF-8目标;
4、支持将文章的内容保存到本地;
5、支持站点+栏目管理模式,采集管理一目了然;
6、支持文章链接替换功能;
7、支持采集器设置无限过滤功能;
8、支持文章中的图片采集保存在本地,文件名自动替换,避免重复;
9、支持将文章中的FLASH文件采集保存到本地;
10、支持限制PHP FOPEN函数功能的虚拟主机;
11、支持采集手动过滤结果,提供“空标题、空内容”的快速过滤和删除;
12、支持PHPWIND、Discuz论坛指南库,程序包收录2大论坛指南库规则和操作指南说明;
13、支持自定义入库间隔,避免并发虚拟主机数限制。