优采云采集器下载地址

优采云 发布时间: 2020-08-06 18:24

  

  优采云采集器是适用于大多数网站的网页信息采集软件. 优采云采集器可以实现智能识别,快速采集和多格式数据输出的效果,满足您在指定网页上进行数据采集的需求. 需求.

  

  软件功能

  1. 一键式数据提取: 简单易学,通过可视界面,只需单击鼠标即可获取数据.

  2. 快速高效: 内置一组高速浏览器内核以及HTTP引擎模式,可实现快速数据采集.

  3. 适用于各种网站: 它可以采集99%的Internet网站,包括单页应用程序,Ajax加载和其他动态网站.

  4. 有许多类型的导出数据. 采集的数据可以导出到Csv,Excel和各种数据库,并且支持api导出.

  软件功能

  1. 向导模式: 简单易用,鼠标点击即可轻松生成;

  2. 脚本定期运行: 可以按计划定期运行,无需人工;

  3. 原创的高速内核: 自主开发的浏览器内核,速度极快,远远超过对手;

  4. 智能识别: 可以智能识别网页中的列表和表单结构(多选框下拉列表等);

  5. 广告屏蔽: 自定义广告屏蔽模块,与AdblockPlus语法兼容,可以添加自定义规则;

  6. 各种数据导出: 支持Txt,Excel,MySQL,SQLServer,SQlite,Access,网站等.

  核心技术

  1. 自动识别列表数据,并通过智能算法一键提取数据;

  2. 自动识别和寻呼技术,通过算法智能识别和采集寻呼数据;

  3. 考虑到易用性和效率,混合浏览器引擎和HTTP引擎.

  使用方法

  一个: 输入采集网址

  打开软件,创建一个新任务,然后输入要采集的网站地址.

  二: 智能分析,在整个过程中自动提取数据

  进入第二步后,优采云采集器会自动智能地分析网页并从中提取列表数据.

  三: 将数据导出到表,数据库,网站等

  运行任务,将采集的数据导出到表,网站和各种数据库中,并支持api导出.

  计算机系统要求

  可以支持Windows XP以上的系统.

  .Net 4.0 Framework,下载链接

  安装步骤

  第一步: 打开下载的安装包,然后选择直接运行它.

  步骤2: 收到相关条款后,运行安装程序PashanhuV2Setup.exe. 安装

  

  第3步: 然后继续单击“下一步”,直到完成为止.

  第4步: 安装完成后,您可以看到优采云采集器 V2主界面的主界面

  

  常见问题解答

  1. 如何从网页的移动版本中采集数据?

  在通常情况下,网站具有计算机版本和移动版本. 如果PC版本的反抓取非常严格,我们可以尝试抓取移动页面.

  ①选择创建新的编辑任务;

  ②在新创建的[编辑任务]中,选择[步骤3,设置];

  

  ③将UA(浏览器标识)设置为“手机”.

  2. 如何手动选择列表数据(自动识别失败时)

  在采集列表页面时,如果列表的自动识别失败,或者所识别的数据不是我们认为的数据,那么我们需要手动选择列表数据.

  如何手动选择列表数据?

  ①单击[全部清除]以清除现有字段.

  

  ②单击菜单栏中的[列表数据],选择[选择列表]

  

  ③使用鼠标单击列表中的任何元素.

  

  ④单击列表另一行中的相似元素.

  

  在通常情况下,采集器此时将自动枚举列表中的所有字段. 我们可以对结果进行一些更改.

  如果未列出字段,则需要手动添加字段. 单击[添加字段],然后单击列表中的元素数据.

  3. 如果在采集文章文本时无法用鼠标选择全部内容,该怎么办?

  在通常情况下,在优采云采集器中,用鼠标单击以选择要捕获的内容. 但是在某些情况下,例如当您想获取文章的完整内容,内容很长时,有时很难找到鼠标.

  ①我们可以通过右键单击网页并选择[检查元素]来找到内容.

  

  ②通过单击[向上]按钮来放大所选内容.

  

  ③扩展到我们的全部内容时,选择所有[XPath]并复制.

  

  ④修改字段的XPath,粘贴到刚复制的XPath中,然后确认.

  

  ⑤最后,修改值属性. 如果需要HMTL,请使用InnerHTML或OuterHTML.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线