智能识别,一键采集(优采云采集器官网版特色一键提取数据简单易学(组图))

优采云 发布时间: 2022-02-05 18:11

  智能识别,一键采集(优采云采集器官网版特色一键提取数据简单易学(组图))

  优采云采集器官网版是一款网络信息采集软件,适合大部分网站,优采云采集器可以实现智能识别,快速< @采集,生成多格式数据输出的效果,满足你对指定网页数据采集的需求。如果需要对指定的网页数据执行采集,可以使用本软件。

  

  优采云采集器官网版功能

  一键提取数据

  简单易学,通过可视化界面,鼠标点击即可抓取数据

  快速高效

  内置一套高速浏览器内核,配合HTTP引擎模式,实现快速采集数据

  适用于各种网站

  能够采集99%的互联网网站,包括单页应用Ajax加载等动态类型网站

  优采云采集器官网功能

  向导模式

  使用简单,通过鼠标点击轻松自动生成

  定期运行的脚本

  无需人工即可按计划运行

  原装高速核心

  自研浏览器内核速度快,远超对手

  智能识别

  智能识别网页中的列表和表单结构(多选框下拉列表等)

  广告拦截

  自定义广告拦截模块,兼容AdblockPlus语法,可添加自定义规则

  各种数据导出

  支持Txt、Excel、MySQL、SQLServer、SQlite、Access、网站等。

  优采云采集器官网版安装教程

  第一步:打开下载的安装包,直接选择运行。

  第二步:收到相关条款后,运行安装程序PashanhuV2Setup.exe。安装

  

  第3步:然后继续单击下一步直到完成。

  第四步:安装完成后可以看到优采云采集器V2的主界面

  

  优采云采集器官网使用方法

  第 1 步:输入 采集 网址

  打开软件,新建一个任务,输入需要采集的网站地址。

  第二步:智能分析,全过程自动提取数据

  进入第二步后,优采云采集器自动智能分析网页,从中提取列表数据。

  步骤 3:将数据导出到表、数据库、网站 等。

  运行任务,将采集中的数据导出到Csv、Excel等各种数据库,支持api导出。

  优采云采集器官网FAQ

  1、如何采集移动网页数据?

  一般情况下,一个网站有电脑版网页和手机版网页。如果电脑版(PC)网页的反爬虫非常严格,我们可以尝试爬取手机网页。

  ①选择新的编辑任务;

  ②在新建的【编辑任务】中,选择【第三步,设置】;

  

  ③ 将UA(浏览器ID)设置为“手机”。

  2、如何手动选择列表数据(自动识别失败时)

  在采集列表页面,如果列表自动识别失败,或者识别出的数据不是我们想到的数据,那么我们需要手动选择列表数据。

  如何手动选择列表数据?

  ①点击【全部清除】,清除已有字段。

  

  ②点击菜单栏上的【列表数据】,选择【选择列表】

  

  ③ 用鼠标单击列表中的任意元素。

  

  ④ 单击列表中另一行的相似元素。

  

  一般情况下,此时采集器会自动枚举列表中的所有字段。我们可以对结果进行一些修改。

  如果没有列出字段,我们需要手动添加字段。单击[添加字段],然后单击列表中的元素数据。

  3、采集文章鼠标不能全选怎么办?

  一般情况下,在优采云采集器中,点击鼠标选择要抓取的内容。但是,在某些情况下,比如要抓取一个文章的完整内容时,当内容较长时,鼠标有时会难以定位。

  ①我们可以通过在网页上右击选择【Inspect Element】来定位内容。

  

  ② 点击【向上】按钮,展开选中的内容。

  

  ③ 展开到我们全部内容的时候,全选【XPath】,然后复制。

  

  ④修改字段的XPath,粘贴刚才复制的XPath,确认。

  

  ⑤ 最后修改value属性,如果要HMTL,使用InnerHTML或OuterHTML。

  

  优采云采集器官网版本更新日志

  新增任务列表拖拽操作、多选、批量操作

  添加了分组的计划任务

  增加请求拦截功能

  添加了通过单击采集(在“字段”菜单下)向下钻取的功能

  简单的采集任务参数,新增多行模式和从文件导入功能

  为任务编辑器添加了浏览器选项卡图标

  新增开机自启动软件功能

  适应高分辨率屏幕(高DPI

  将tab执行脚本命令选项移到脚本编辑界面

  优化滚动命令

  删除禁用闪光灯,弹出选项

  优化定时任务设置

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线