采集文章软件(守望采集器采集规则及操作指南说明;守望程序)
优采云 发布时间: 2021-09-12 09:15Watch采集器是一款绿色免费的文章数据采集软件,可以用来采集各种数据在线。支持采集进程断点续传功能,不受浏览器意外关闭的影响,重启后不会重复采集。只需鼠标复制粘贴即可生成完美的采集规则,没有繁琐的过程,即使您是新手,也可以使用任何内容触手可及采集器采集!
功能介绍
1、support文章内容分页采集;
2、支持论坛采集
3、支持UTF-8转GB2312,采集内容字符格式可以作为UTF-8的目标;
4、支持本地保存文章内容;
5、支持站点+栏目管理模式,采集管理一目了然;
6、支持文章link替换功能;
7、支持采集器设置无限过滤功能;
8、支持文章内图片采集保存到本地,自动替换文件名避免重复;
9、support 文章内FLASH file采集保存到本地;
10、支持限制PHP FOPEN功能的虚拟主机;
11、支持采集结果的手动过滤,并提供“空标题空内容”的快速过滤和删除;
12、支持PHPWIND、Discuz论坛指南库,程序包中收录2个论坛指南库规则和操作说明;
13、支持自定义入仓间隔时间,避免虚拟主机并发限制。
观看采集器优势
1、守望程序使用PHP开发,支持跨平台操作。它可以在 Windows 和 Unix 操作系统上运行。是一款高效的采集在线应用软件,完美入库。
2、守望不受安装位置限制。可以在家里、工作电脑、网站服务器上使用;建议直接安装在网站服务器上,可以更好的了解收网的超强功能和便捷性。
3、采用服务器安装,可以直接抓取采集的图片/Flash到机器上使用;不需要像其他采集器采集一样通过FTP将数据上传到个人电脑到服务器。想象一下,如果那天你的采集图片和Flash超过100M,上传时间是什么概念。
4、采用服务器安装,可快速导入采集内容cms文章系统或BBS论坛系统;如果使用离线采集器,远程存储或上传SQL文件到存储会浪费时间。
5、守望独特的断点续传和重复采集过滤功能,为您节省创作时间。
观看采集器使用教程
我主要讲怎么导入你的网站。至于采集规则怎么写,这个很简单,这里不再赘述!
导入原理:主要是利用系统的api函数模拟打开浏览器,自动将采集数据填入表单中,并自动提交。
1. 首先设置你的网站参数,模拟导入不受网站系统、地理位置、编码方式、网站language...的影响,可以导入任何可连接的网站,所以这个版本新增加了dvbbs(动网),php168、phpcms......导入程序,如果你没有网站导入程序,可以联系我为你写!
2.已测试导入gb2312、utf-8、big5……encoded 网站,但是导入big5编码网站后,可能会出现一点乱码现象(不多)。
3.Import时间间隔,这个参数很重要,如果你的网站连接速度很慢,请设置这个参数,本地测试可以设置为0。单位:毫秒(1秒=1000毫秒)
4.最重要的一点:→你必须在IE浏览器中登录你的网站,然后执行导入数据!
例如:你的网站(DZ)
首先启动IE,连接你的网站,登录,用你想发帖的用户登录。 cookie 保存了很长时间。登录后不要关闭IE,直接最小化即可。
然后采集data,选择目标,导入数据!
PC正式版
安卓官方手机版
IOS官方手机版