采集器采集(如何过滤列表中的前N个数据?有时教学说明)

优采云 发布时间: 2021-11-23 01:03

  采集器采集(如何过滤列表中的前N个数据?有时教学说明)

  优采云采集器 正式版是专为采集数据设计的软件,通过它用户可以更方便地进行采集,同时具有多种输出格式,并且也可以自动生成Script,支持大部分网站。

  优采云采集器 教学说明

  一:输入采集 URL

  打开软件,新建一个任务,输入需要采集的网站地址。

  2:智能分析,全程自动提取数据

  进入第二步后,优采云采集器自动对网页进行智能分析,从中提取列表数据。

  三:导出数据到表、数据库、网站等。

  运行任务,将采集中的数据导出到表、网站和各种数据库中,支持api导出。

  

  优采云采集器软件特点

  脚本定期运行

  可按计划定时运行,无需人工

  向导模式

  简单易用,轻松通过鼠标点击自动生成

  原装高速核心

  自主研发的浏览器内核速度快,远超对手

  广告拦截

  自定义广告拦截模块,兼容AdblockPlus语法,可添加自定义规则

  智能识别

  可智能识别网页中的列表和表单结构(多选框下拉列表等)

  各种数据导出

  支持 Txt、excel、mysql、SQLServer、SQlite、access、网站 等。

  应用优势

  简单易学,通过可视化界面,鼠标点击即可采集数据

  内置一套高速浏览器内核,加上HTTP引擎模式,实现快速采集数据

  能够采集99%的互联网网站,包括单页应用Ajax加载等动态类型网站

  常见问题

  Q:如何通过抓包获取cookie并手动设置?

  1.首先用谷歌浏览器打开你要采集的网站,然后登录。

  2. 然后按F12,会出现开发者工具,选择Network

  3.然后按F5刷新下一页并选择其中一个请求。

  4.复制完成后,在优采云采集器中编辑任务,进入第三步指定HTTP Header。

  Q:如何过滤列表中的前N个数据?

  1.有时我们需要过滤采集收到的列表,比如过滤掉第一组数据(以采集的形式,过滤掉表列名)

  2.在列表模式菜单中点击设置列表xpath

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线