内容采集器(优采云采集器能生成Excel表格,api数据库文件等内容介绍)

优采云 发布时间: 2022-02-01 06:05

  内容采集器(优采云采集器能生成Excel表格,api数据库文件等内容介绍)

  优采云采集器v3.0.3.3是一款简单实用、全面高效的网络信息采集软件,优采云 采集器可以生成Excel表格、api数据库文件等,帮助您管理网站数据信息。如果需要对指定的网页数据执行采集,喜欢就赶紧来下载吧!

  

  软件功能

  一键提取数据

  简单易学,通过可视化界面,点击鼠标即可抓取数据;

  快速高效

  内置一套高速浏览器内核,配合HTTP引擎模式,实现快速采集数据;

  适用于各种网站

  可以采集99%的互联网网站,包括单页应用Ajax加载等动态类型网站;

  特征

  向导模式

  简单易用,轻松鼠标点击自动生成;

  定期运行的脚本

  无需人工即可按计划定时运行;

  原装高速核心

  自研浏览器内核速度快,远超对手;

  智能识别

  可智能识别网页中的列表和表单结构(多选框下拉列表等);

  广告拦截

  自定义广告拦截模块,兼容AdblockPlus语法,可添加自定义规则;

  各种数据导出

  支持Txt、Excel、MySQL、SQLServer、SQlite、Access、网站等;

  指示

  第 1 步:输入 采集 网址

  打开软件,新建一个任务,输入需要采集的网站地址。

  第二步:智能分析,全过程自动提取数据

  进入第二步后,优采云采集器自动智能分析网页,从中提取列表数据。

  步骤 3:将数据导出到表、数据库、网站 等。

  运行任务,将采集中的数据导出到Csv、Excel等各种数据库,支持api导出。

  常见问题

  Q:如何过滤列表中的前N个数据?

  1.有时候我们需要对采集收到的列表进行过滤,比如过滤掉第一组数据(在采集表中,过滤掉表列名)

  2.点击列表模式菜单设置列表xpath

  Q:如何抓包获取cookie并手动设置?

  1.首先用谷歌浏览器打开网站为采集,登录。

  2. 然后按F12,会出现开发者工具,选择Network

  3.然后按 F5 刷新下一页并选择其中一个请求。

  4.复制完成后,在优采云采集器中,编辑任务,进入第三步,指定HTTP Header。

  变更日志

  优化导出数据窗口;

  为 XPath 文本框添加了自动完成和语法高亮;

  新增导出图片到Excel;

  修复了分组调度任务的问题;

  修复其他问题;

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线