智能采集发布器(优采云采集器可以帮助用户快速爬取网站数据,可将数据全部存储在云上)

优采云 发布时间: 2021-09-10 14:14

  智能采集发布器(优采云采集器可以帮助用户快速爬取网站数据,可将数据全部存储在云上)

  优采云采集器可以帮助用户快速抓取网站数据,所有数据都可以存储在云端,无需本地管理,节省大量硬盘空间,支持多级多页面, etc.采集方法和内容发布功能,有需要的用户快来下载吧。

  软件介绍

  优采云采集器是一款免费的数据发布爬虫软件采集。用php+mysql开发,可以部署在云服务器上。几乎可以采集所有类型的网页,无缝连接各类cms建站程序,无需登录即可实时发布数据,全自动无需人工干预,是大数据、云时代网站数据AUTO采集!

  

  软件功能

  关于软件

  优采云采集器(天财记),专门发布网站data自动化采集,系统采用PHP+Mysql开发,可部署在云服务器上,方便采集数据、智能、云端让您随时随地移动办公!

  数据采集

  支持多级、多页面、分页采集、自定义采集规则(支持regular、XPATH、JSON等)准确匹配任何信息流,几乎采集所有类型的网页,大部分文章type页面内容可以实现智能识别

  内容发布

  无缝对接各种cms建站程序,实现免登录数据导入,支持自定义数据发布插件,或直接导入数据库,保存为Excel文件,生成API接口等

  自动化和云平台

  软件实现全自动采集定时发布、量化,无需人工干预!内置云平台,用户可以分享下载采集规则,发布供需信息,社区帮助,交流等。

  如何使用

  升级软件

  可以直接在后台首页查看更新并点击升级,也可以上传压缩包到服务器解压覆盖!

  安装软件

  将下载的软件上传到您的服务器。如果根目录下有站点,建议放在子目录下。解压后打开浏览器输入你的服务器域名或ip地址(存放在子目录时添加子目录名),进入安装界面

  

  点击“接受”进入环境检测页面

  

  必须确保所有参数正确,否则使用过程中会出现错误,点击“下一步”进入数据安装界面

  

  填写数据库和创始人配置,点击“下一步”

  

  终于安装完成了,现在可以使用优采云采集器了!

  匹配规则

  “规则”支持:(*)(通配符)、正则表达式,使用[content](万能匹配)或捕获组(常规捕获组)将匹配的数据保存为标签,并在“拼接”中引用content" [Content N] 标签合成结果

  [content]和捕获组的区别:[content]会自动转换成固定格式的捕获组:(?.*?)

  捕获组:(?[\s\S]*?),可以写任何正则表达式

  [Content]适用于一般匹配精度不高,捕获组适用于精确匹配

  默认为单个匹配,多个匹配可以勾选“允许多个元素匹配”

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线