最新版:优采云采集器 v2.1.8.0官方版下载

优采云 发布时间: 2020-08-31 22:04

  优采云采集器v2.1.8.0正式版下载

  

  优采云采集器是一款适合大多数网站Web信息采集的软件. 优采云采集器可以实现智能识别,快速采集,并生成多种格式的数据输出. ,以满足您对指定网页数据采集的需求.

  

  软件功能

  1. 一键式数据提取: 简单易学,您可以通过可视界面用鼠标单击来获取数据.

  2. 快速高效: 内置一组高速浏览器内核以及HTTP引擎模式,以实现快速采集数据.

  3. 适用于各种网站: 采集可以采集99%的Internet网站,包括单页应用程序,Ajax加载和其他动态类型的网站.

  4. 有许多类型的导出数据. 您可以将数据从采集导出到Csv,Excel和各种数据库,并支持api导出.

  软件功能

  1. 向导模式: 易于使用,易于通过单击鼠标自动生成;

  2. 脚本定期运行: 可以按计划定期运行,无需人工;

  3. 原创的高速内核: 自主开发的浏览器内核,速度极快,远远超过对手;

  4. 智能识别: 可以智能识别网页中的列表和表单结构(多选框下拉列表等);

  5. 广告屏蔽: 自定义广告屏蔽模块,与AdblockPlus语法兼容,可以添加自定义规则;

  6. 各种数据导出: 支持Txt,Excel,MySQL,SQLServer,SQlite,Access,网站等.

  核心技术

  1. 自动识别列表数据,并通过智能算法一键提取数据;

  2. 自动识别寻呼技术,智能识别算法,采集寻呼数据;

  3. 混合浏览器引擎和HTTP引擎,同时考虑到易用性和效率.

  使用方法

  一个: 输入采集网址

  打开软件,创建一个新任务,然后输入需要采集的网站地址.

  二: 智能分析,在整个过程中自动提取数据

  进入第二步后,优采云采集器会自动对网页进行智能分析,并从中提取列表数据.

  三: 将数据导出到表,数据库,网站等

  运行任务,将采集中的数据导出到表,网站和各种数据库中,并支持api导出.

  计算机系统要求

  可以支持Windows XP以上的系统.

  .Net 4.0 Framework,下载链接

  安装步骤

  第一步: 打开下载的安装包,然后选择直接运行它.

  步骤2: 收到相关条款后,运行安装程序PashanhuV2Setup.exe. 安装

  

  第3步: 然后继续单击“下一步”,直到完成为止.

  步骤4: 安装完成后,您可以看到优采云采集器V2主界面的主界面

  

  常见问题解答

  1. 如何采集移动版网页的数据?

  在通常情况下,网站具有网页的计算机版本和网页的移动版本. 如果对计算机版本(PC)网页的反爬网非常严格,我们可以尝试对移动网页进行爬网.

  ①选择创建新的编辑任务;

  ②在新创建的[编辑任务]中,选择[步骤3,设置];

  

  ③将UA(浏览器标识)设置为“手机”.

  2. 如何手动选择列表数据(自动识别失败时)

  在采集列表页面中,如果列表的自动识别失败,或者所识别的数据不是我们认为的数据,那么我们需要手动选择列表数据.

  如何手动选择列表数据?

  ①单击[全部清除]清除现有字段.

  

  ②单击菜单栏中的[列表数据],选择[选择列表]

  

  ③使用鼠标单击列表中的任何元素.

  

  ④单击列表另一行中的相似元素.

  

  在通常情况下,采集器将自动枚举列表中的所有字段. 我们可以对结果进行一些更改.

  如果未列出字段,则需要手动添加字段. 单击[添加字段],然后单击列表中的元素数据.

  3. 对于采集文章文字,如果鼠标无法选择全部内容该怎么办?

  通常,在优采云采集器中,用鼠标单击以选择要捕获的内容. 但是,在某些情况下,例如当您想获取文章的完整内容时,当内容很长时,有时很难找到鼠标.

  ①我们可以通过右键单击网页并选择[检查元素]来找到内容.

  

  ②通过单击[向上]按钮来放大所选内容.

  

  ③扩展到我们的全部内容时,选择所有[XPath]并复制.

  

  ④修改字段的XPath,粘贴到刚刚复制的XPath中,然后确认.

  

  ⑤最后,修改值属性. 如果需要HMTL,请使用InnerHTML或OuterHTML.

  

  软件特别说明

  360安全卫士用户注意: 由于360软件的错误警报,单个文件(包括uninst.exe)被删除,导致程序无法正常运行,请在退出之前退出360软件安装

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线