优采云采集器 v2.3.2的最新正式版本

优采云 发布时间: 2020-08-07 20:45

  优采云采集器可以帮助用户快速抓取网站数据,无需本地管理即可将所有数据存储在云中,节省大量硬盘空间,支持多级和多页采集方法以及内容发布功能,用户谁需要它,来下载它.

  软件简介

  优采云采集器是用于数据采集和发布的免费爬虫软件. 它是用php + mysql开发的,可以部署在云服务器上. 它可以采集几乎所有类型的网页,并且无需登录即可无缝连接各种CMS网站构建程序. 实时实时发布数据,无需人工干预. 它是在云时代自动采集大数据和网站数据的最佳云爬虫软件!

  

  软件功能

  关于软件

  SkyCaiji致力于自动采集和发布网站数据. 该系统是用PHP + Mysql开发的,可以部署在云服务器上,从而使数据采集变得方便,智能且基于云,使您可以随时随地在Office上移动!

  数据采集

  支持多级,多页和分页采集,自定义采集规则(支持常规,XPATH,JSON等)准确匹配任何信息流,几乎所有类型的网页都可以采集,并且内容大多数文章类型都可以智能识别

  内容发布

  与各种CMS网站构建程序无缝对接,实现免登录导入数据,支持自定义数据发布插件或直接导入数据库,存储为Excel文件,生成API接口等.

  自动化和云平台

  该软件可实现定时和定量自动采集和发布,而无需人工干预!内置的云平台,用户可以共享和下载采集规则,发布供需信息以及社区帮助,交流等.

  使用方法

  升级软件

  您可以直接在后台主页上检查更新并单击升级,或将压缩包上传到服务器以解压并覆盖它!

  安装软件

  将下载的软件上载到您的服务器. 如果根目录中有一个站点,建议将其放在子目录中. 解压缩后,打开浏览器并输入服务器域名或IP地址(存储在子目录中时添加子目录的名称),进入安装界面

  

  点击“接受”进入环境检测页面

  

  您必须确保所有参数正确,否则在使用过程中会发生错误,请单击“下一步”进入数据安装界面

  

  填写数据库和Founder配置,单击“下一步”

  

  最后,安装完成,现在您可以使用优采云采集器了!

  匹配规则

  “规则”支持: (*)(通配符),正则表达式,使用[content](通用匹配)或捕获组(常规捕获组)将匹配的数据另存为标记,并在“拼接的”中引用内容” [内容N]标签组成结果

  [内容]和捕获组之间的区别: [内容]将自动转换为固定格式的捕获组: (?. *?)

  捕获组: (?[\ s \ S] *?),您可以编写任何正则表达式

  [内容]适用于精度较低的常规匹配,捕获组适用于精确匹配

  默认为单个匹配项,可以选中多个匹配项“允许多个元素匹配”

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线