优采云采集器v2.3.2官方版

优采云 发布时间: 2020-08-23 12:31

  优采云采集器v2.3.2官方版

  

  优采云采集器是一款免费的大数据采集发布系统,可以实现无限制云端自动化采集数据,在笔记本或手机上使用浏览器就可以采集数据,采集的范围十分广,几乎可以采集所有类型的网页,可智能辨识大多数的文章类型页面内容,可自定义采集规则,而且可以与各类CMS建站程序对接,不用登陆网站就可以导出数据,支持自定义数据发布插件,支持定时定量全手动采集发布,从数据的采集到发布,整个过程全手动不需要人工操作,是网站数据自动化采集发布的最佳云端爬虫软件!

  

  软件特色

  关于软件

  优采云采集器(SkyCaiji),致力于网站数据自动化采集发布,系统采用PHP+Mysql开发,可布署在云端服务器,使数据采集便捷化、智能化、云端化,让您随时随地联通办公!

  数据采集

  支持多级、多页、分页采集,自定义采集规则(支持正则、XPATH、JSON等)精准匹配任意信息流,几乎能采集所有类型的网页,绝大多数文章类型页面内容可实现智能辨识

  内容发布

  无缝对接各种CMS建站程序,实现免登录导出数据,支持自定义数据发布插件,也可以直接导出数据库、存储为Excel文件、生成API接口等

  自动化及云平台

  软件实现定时定量全手动采集发布,无需人工干预!内置云平台,用户可分享及下载采集规则,发布供求信息以及社区求救、交流等

  使用教程

  创建任务

  登录后台,左侧导航中点击“添加任务”

  

  添加任务页面

  “导入任务”可以复制其他任务的所有设置(包括采集器设置、发布设置) “导入规则”可以从其他任务或文件中复制采集器设置 “更多设置”可以为任务单独配置采集设置

  

  采集器设置

  点击任务顶部进度条的“采集器设置”进入规则编辑界面

  输入采集规则名称和目标网站编码(可手动检查) 页面渲染可手动加载出ajax内容,适用于js脚本较多的页面 自动补全网址可以将网页中的相对地址(不收录域名的网址)转为绝对网址(收录域名) 网址不排重,默认会将采集过的内容页排重处理,不排重适用于更新频繁的动态页面 修改恳求头信息以适应须要登陆的、手机浏览的等界面

  

  起始页网址

  添加须要采集的目标列表页

  点击“+”号可批量添加网址,勾选“设置为内容页网址”可直接采集输入的网址,否则作为列表页须要进行剖析提取出内容页网址

  

  内容页网址

  编写提取内容页网址的规则,默认提取所有网址,如需精准可设置“提取网址规则”

  

  多级网址获取:适用于小说、影视等连载方式的内容

  只要内容页网址不是直接从起始页抓取的,都可以通过多级来获取

  

  

  关联页网址获取:适用于数据分散在多个页面中

  如须要抓取的数组不在内容页,而在其他页面中,则可以使用该功能将其他页面也作为内容源

  

  

  获取内容

  “添加默认”可以手动设置几个常见的数组,能满足大部分文章类型的站点采集

  如果目标数据格式比较复杂,可点击“+”自行编撰数组规则,支持正则表达式、xpath、json等多种匹配方法

  

  “数据处理”可将采集到的数组值进行过滤或替换内容,每个数组都可单独处理或使用通用处理

  

  如需抓取分页,点击开启“内容分页”并编撰规则,程序会手动抓取每位分页中的数组内容

  

  测试规则

  采集器配置完成后需点击保存按键,刷新后可在“内容页网址”选项卡和“获取内容”选项卡中见到测试按键

  测试列表页中抓取网址

  

  测试页面中抓取数据

  

  测试抓取分页

  

  优采云采集器与相关软件的区别

  老树地图数据采集大师:老树地图数据采集大师是一款地形图数据采集软件。老树地图数据采集大师通过百度地图、腾讯地图、高德地图、天地图等多个数据源提供的的数据,可以采集到全省各个城市、各个行业的店家数据,能够搜集到手机号,地址,根据位置定位,精准定位精确,数据信息精确。采集到的数据可一键导入到CSV、EXCEL、VCF等文件,VCF文件可直接导出到手机*敏*感*词*。

  抖音爬虫软件:抖音爬虫软件是一款功能丰富的抖音视频下载工具,软件红色免费,可以批量获取抖音上视频及其它内容,支持批量采集某个主播的全部作品,采集视频下边的评论,采集某主播的粉丝,可批量查询帐号总获赞、总粉丝、总作品等数据,可批量获取某个音频下的作品,支持按热门、最新排序,支持抖音长链接转短链接,支持获取抖音榜单,包括好物榜单、音乐榜单、今日最热等。

  地图数据采集专家:地图数据采集专家是一款简单好用的地图数据采集软件,软件使用特别简单便捷,只需可以输入想要查询的城市,就会手动采集这个城市地图范围内的商户信息,包括商户名称,电话,地址,联系信息,坐标等内容,可自行设置想要查询的关键词,支持数据过滤,可设置标题或地址想要排除的词,或标题必须收录的词,采集的数据支持到市级,可将数据导入到Excel,CSV,VCF等格式,数据来自于360、百度、高德多个地图源,数据精准并且最新。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线