守望采集器支持采集过程功能介绍及操作指南说明
优采云 发布时间: 2021-08-11 21:16守望采集器支持采集过程功能介绍及操作指南说明
支持采集进程断点续传功能,不受浏览器意外关闭影响,重启后不会重复采集;支持自动比较过滤功能,不会重复采集采集与存储的链接系统;以上两个功能可以大大减少采集时间,减少系统负载。 采集rule嗅探器,你只需要简单的鼠标复制粘贴就可以生成完美的采集规则,没有繁琐的过程,即使你是新手,也可以用watch采集器采集什么的!
功能介绍
1、采集 对象不限,只要能连接页面即可;
2、采集对象支持:文章、图片、Flash、视频等
3、完美的内容存储方案,守望采集器提供两种存储方式:直接数据库引导和模拟提交。
1)Database 直接引导方式支持任何基于Mysql数据库存储信息的内容管理系统;
2)模拟提交方式理论上支持任何目标,不受目标编程语言和数据库类别的限制;实际使用效果受目标应用影响。
软件功能
1、support文章内容分页采集;
2、支持论坛采集
3、支持UTF-8转GB2312,采集内容字符格式可以作为UTF-8的目标;
4、支持本地保存文章内容;
5、支持站点+栏目管理模式,采集管理一目了然;
6、支持文章link替换功能;
7、支持采集器设置无限过滤功能;
8、support文章内图片采集保存到本地,自动替换文件名,避免重复;
9、support 文章内FLASH file采集保存到本地;
10、支持限制PHP FOPEN功能的虚拟主机;
11、支持手动筛选采集结果,并提供“空标题空内容”的快速过滤和删除;
12、支持PHPWIND、Discuz论坛指南库,程序包中收录2个论坛指南库规则和操作说明;
13、支持自定义入仓间隔时间,避免虚拟主机并发限制。