优采云采集器 v2.8 免费版

优采云 发布时间: 2020-08-12 07:40

  优采云采集器免费版是一款功能强悍而且实用的网页数据采集工具。这款软件具有零门槛、多引擎、*敏*感*词*这几个特性。该软件还能使一个不懂网路爬虫技术的人,轻松的采集网络信息,适合99%的网站,同时它能够够智能的防止获得重复的数据。支持丰富的数据导入方法,可以导入为txt文件、html文件、csv文件、excel文件,也可以导入到已有的数据库,如sqlite数据库、access数据库、sqlserver数据库、mysql数据库,通过向导的方法简单映射数组,即可轻松导入到目标网站数据库中。感兴趣的同事快来下载吧。

  软件特色:

  1、适用各类网站 :能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站。

  2、多引擎,高速稳定:内置高速浏览器引擎,还可以切换为HTTP引擎模式运行,采集数据愈发高效。还外置了JSON引擎,无需剖析JSON数据结构,可视化选定JSON内容。

  3、零门槛:不懂网路爬虫技术,会上网,就会采集网站数据。

  软件功能:

  1、可视化向导

  所有采集元素,自动生成采集数据。

  2、计划任务

  灵活定义运行时间,全自动运行。

  3、多引擎支持

  支持多个采集引擎,内置高速浏览器内核、HTTP引擎和JSON引擎。

  4、智能辨识

  可手动辨识网页列表、采集字段和分页等。

  5、拦截恳求

  自定义拦截域名,方便过滤站外广告,提高采集速度。

  6、多种数据导入

  可导入为Txt 、Excel、MySQL、SQLServer、 SQlite、Access、网站等。

  亮点介绍:

  1、软件操作简单,可通过键盘点击的形式轻松选定要抓取的内容;

  2、支持三种高速引擎:浏览器引擎、HTTP引擎、JSON引擎,内置优化后的火狐浏览器,加上独创的内存优化让浏览器采集也可以高速运行,甚至可以快速转换为HTTP方法运行,享受更高的采集速度!而在抓取JSON数据时,同样可以使用浏览器可视化形式,通过键盘点选须要抓取的内容,完全不需要去剖析JSON数据结构,使非网页专业设计人士也可以轻松抓取须要的数据;

  3、不用剖析网页恳求和源代码,却支持更多的网页采集;

  4、先进的智能算法,可以一键生成目标元素XPATH、自动辨识网页列表、自动辨识分页中的下一页按键……

  5、支持丰富的数据导入方法,可以导入为txt文件、html文件、csv文件、excel文件,也可以导入到已有的数据库,如sqlite数据库、access数据库、sqlserver数据库、mysql数据库,通过向导的方法简单映射数组,即可轻松导入到目标网站数据库中。

  常见问题:

  1、采集时如何防止重复到重复数据?

  方法很简单,我们希望哪一个数组内容不容许出现重复,只要点击该数组表身上这个三角符号,再勾选“过滤重复”复选框,点击确定就可以了

  2、如何自动生成主键?

  点击“增加数组”按钮

  点击列表中任意一行中要提取的元素,比如要提取标题和链接地址,鼠标左键点击一下该标题即可

  当点击的是网页链接时,会提示是否用时要抓取链接地址

  如果要同时提取链接标题和链接地址,点“是”,如果只要提取标题文本,点否,这里我们点“是”

  系统会手动生成标题和链接地址数组,并在数组列表中显示出提取到的数组内容,当点击顶部表格数组标题时,会在网页上以红色背景高亮显示出匹配的内容。

  如何还有标记列表中的其他数组,点击新增数组,重复以上操作即可。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线