智能采集发布器(优采云采集器可以帮助用户快速爬取网站数据,可将数据全部存储在云上)
优采云 发布时间: 2021-09-10 14:14智能采集发布器(优采云采集器可以帮助用户快速爬取网站数据,可将数据全部存储在云上)
优采云采集器可以帮助用户快速抓取网站数据,所有数据都可以存储在云端,无需本地管理,节省大量硬盘空间,支持多级多页面, etc.采集方法和内容发布功能,有需要的用户快来下载吧。
软件介绍
优采云采集器是一款免费的数据发布爬虫软件采集。用php+mysql开发,可以部署在云服务器上。几乎可以采集所有类型的网页,无缝连接各类cms建站程序,无需登录即可实时发布数据,全自动无需人工干预,是大数据、云时代网站数据AUTO采集!
软件功能
关于软件
优采云采集器(天财记),专门发布网站data自动化采集,系统采用PHP+Mysql开发,可部署在云服务器上,方便采集数据、智能、云端让您随时随地移动办公!
数据采集
支持多级、多页面、分页采集、自定义采集规则(支持regular、XPATH、JSON等)准确匹配任何信息流,几乎采集所有类型的网页,大部分文章type页面内容可以实现智能识别
内容发布
无缝对接各种cms建站程序,实现免登录数据导入,支持自定义数据发布插件,或直接导入数据库,保存为Excel文件,生成API接口等
自动化和云平台
软件实现全自动采集定时发布、量化,无需人工干预!内置云平台,用户可以分享下载采集规则,发布供需信息,社区帮助,交流等。
如何使用
升级软件
可以直接在后台首页查看更新并点击升级,也可以上传压缩包到服务器解压覆盖!
安装软件
将下载的软件上传到您的服务器。如果根目录下有站点,建议放在子目录下。解压后打开浏览器输入你的服务器域名或ip地址(存放在子目录时添加子目录名),进入安装界面
点击“接受”进入环境检测页面
必须确保所有参数正确,否则使用过程中会出现错误,点击“下一步”进入数据安装界面
填写数据库和创始人配置,点击“下一步”
终于安装完成了,现在可以使用优采云采集器了!
匹配规则
“规则”支持:(*)(通配符)、正则表达式,使用[content](万能匹配)或捕获组(常规捕获组)将匹配的数据保存为标签,并在“拼接”中引用content" [Content N] 标签合成结果
[content]和捕获组的区别:[content]会自动转换成固定格式的捕获组:(?.*?)
捕获组:(?[\s\S]*?),可以写任何正则表达式
[Content]适用于一般匹配精度不高,捕获组适用于精确匹配
默认为单个匹配,多个匹配可以勾选“允许多个元素匹配”