优采云文章采集api(优采云采集器:如何过滤列表中的前N个数据?)
优采云 发布时间: 2022-04-01 13:06优采云文章采集api(优采云采集器:如何过滤列表中的前N个数据?)
优采云采集器是一款高效的网页信息采集软件,支持99%的网站data采集,可以生成Excel表格、api数据库文件等. 帮你管理网站数据信息,非常好用,快来下载吧。
软件功能
一键提取数据
简单易学,通过可视化界面,鼠标点击即可抓取数据
快速高效
内置一套高速浏览器内核,配合HTTP引擎模式,实现快速采集数据
适用于各种网站
能够采集99%的互联网网站,包括单页应用Ajax加载等动态类型网站
特征
向导模式
使用简单,通过鼠标点击轻松自动生成
定期运行的脚本
无需人工即可按计划运行
原装高速核心
自研浏览器内核速度快,远超对手
智能识别
智能识别网页中的列表和表单结构(多选框下拉列表等)
广告拦截
自定义广告拦截模块,兼容AdblockPlus语法,可添加自定义规则
各种数据导出
支持Txt、Excel、MySQL、SQLServer、SQlite、Access、网站等。
指示
第 1 步:输入 采集 网址
打开软件,新建一个任务,输入需要采集的网站地址。
第二步:智能分析,全过程自动提取数据
进入第二步后,优采云采集器自动智能分析网页,从中提取列表数据。
步骤 3:将数据导出到表、数据库、网站 等。
运行任务,将采集中的数据导出到Csv、Excel等各种数据库,支持api导出。
常见问题
Q:如何过滤列表中的前N个数据?
1.有时我们需要对采集收到的列表进行过滤,比如过滤掉第一组数据(在采集表中,过滤掉表列名)
2.点击列表模式菜单设置列表xpath
Q:如何抓包获取cookie并手动设置?
1.首先用谷歌浏览器打开网站为采集,登录。
2. 然后按F12,会出现开发者工具,选择Network
3.然后按 F5 刷新下一页并选择其中一个请求。
4.复制完成后,在优采云采集器中,编辑任务,进入第三步,指定HTTP Header。
变更日志
3.0.3.1
2021/08/07
添加任务右键菜单图标
修复列表识别问题
优化瀑布滚动
优化点击钻取功能
修复导出配置重命名问题
修复了分组计划任务以包括所有子分组任务
优化查看数据窗口的分页控制
其他细节的修改
这个工具是维夏小编推荐给大家的。如果您需要,欢迎您下载使用。