内容采集软件(www.ucaiyun.com软件特色规则通过采集规则的定义工具介绍)
优采云 发布时间: 2021-09-08 08:11内容采集软件(www.ucaiyun.com软件特色规则通过采集规则的定义工具介绍)
是一个非常有用的文章采集器 工具。该软件可以帮助我们快速采集一些网站的文章和数据,并支持从网上抓取获取文本、图片、文件等资源附件,抓取的资源可以导入到数据库中。该软件简单实用。有需要的朋友赶紧下载吧。
采集tutorial
1、采集 URL 规则,点击添加。
2、选择【批量/多页】,添加常规网址,输入第一项和页数。点击【添加】完成。
3、双击【标题】,弹出标题编辑框。
4、提取方式一般为【前后截取】,通过观察源码,填写开始字符串和结束字符串。
5、Post 内容设置。启用方法二保存采集结果。
软件特点
规则自定义
通过采集规则的定义,可以搜索到网站采集几乎所有类型的信息。
多任务、多线程
多个信息采集任务可以同时执行,每个任务可以使用多个线程。
数据保存
数据边采集边自动保存在关系数据库中,可以自动适配数据结构。软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以灵活的将数据导入到客户现有的数据库结构中。
断点恢复挖矿
信息采集task 停止采集后可以从断点继续,从此不用担心采集任务被意外中断。
网站登录
支持网站Cookie和网站visualized登录,即使网站登录时需要验证码,也可以采集。
预定任务
通过此功能,您的采集任务可以定期、定量或始终循环执行。
采集范围限制
采集的范围可以根据采集的深度和网址的logo进行限制。
更新日志
修复BUG
简化文件
优化程序