免费网页采集器(优采云 采集器问:如何过滤列表中的前N个数据?)
优采云 发布时间: 2021-12-29 11:01免费网页采集器(优采云
采集器问:如何过滤列表中的前N个数据?)
优采云
Collector V2是一款高效的网页信息采集软件,支持99%的网站数据采集。优采云
采集
器可以生成Excel表格、api数据库文件等内容来帮助您管理网站数据信息,如果您需要从指定网页采集
数据,只需使用该软件即可。
优采云
采集
器软件功能
一键提取数据
简单易学,通过可视化界面,鼠标点击即可采集数据
快速高效
内置一套高速浏览器内核,外加HTTP引擎模式,实现快速数据采集
适用于各种网站
能够采集
99%的互联网站点,包括单页应用Ajax加载等动态类型站点
优采云
采集
器功能介绍
向导模式
简单易用,轻松通过鼠标点击自动生成
脚本定期运行
可按计划定时运行,无需人工
原装高速核心
自研浏览器内核,速度快,远超对手
智能识别
可智能识别网页中的列表和表单结构(多选框下拉列表等)
广告拦截
自定义广告拦截模块,兼容AdblockPlus语法,可添加自定义规则
各种数据导出
支持 Txt、Excel、MySQL、SQLServer、SQlite、Access、网站等。
优采云
如何使用采集
器
第一步:输入采集
网址
打开软件,新建一个任务,输入需要采集的网址。
第二步:智能分析,全程自动提取数据
进入第二步后,优采云
采集
器自动智能分析网页,从中提取列表数据。
第三步:将数据导出到表格、数据库、网站等。
运行任务,将采集到的数据导出到Csv、Excel及各种数据库,支持api导出。
优采云
关于采集器
的常见问题
问题:如何过滤列表中的前N个数据?
1.有时候我们需要过滤采集
到的列表,比如过滤掉第一组数据(采集
表的时候,过滤掉表列名)
2.在列表模式菜单中点击设置列表xpath
Q:如何通过抓包获取cookie并手动设置?
1.首先使用谷歌浏览器打开要采集的网站,并登录。
2.然后按F12,会出现开发者工具,选择Network
3.然后按F5刷新下一页并选择其中一个请求。
4. 复制完成后,在优采云
采集
器中,编辑任务,进入第三步指定HTTP Header。
优采云
采集
器更新日志
优化导出数据窗口
XPath 文本框增加自动补全和语法高亮功能
添加导出图片到Excel
修复组计划任务的问题
修复其他问题