最新版:优采云采集器 v2.1.8.0官方版下载
优采云 发布时间: 2020-08-31 22:04优采云采集器v2.1.8.0正式版下载
优采云采集器是一款适合大多数网站Web信息采集的软件. 优采云采集器可以实现智能识别,快速采集,并生成多种格式的数据输出. ,以满足您对指定网页数据采集的需求.
软件功能
1. 一键式数据提取: 简单易学,您可以通过可视界面用鼠标单击来获取数据.
2. 快速高效: 内置一组高速浏览器内核以及HTTP引擎模式,以实现快速采集数据.
3. 适用于各种网站: 采集可以采集99%的Internet网站,包括单页应用程序,Ajax加载和其他动态类型的网站.
4. 有许多类型的导出数据. 您可以将数据从采集导出到Csv,Excel和各种数据库,并支持api导出.
软件功能
1. 向导模式: 易于使用,易于通过单击鼠标自动生成;
2. 脚本定期运行: 可以按计划定期运行,无需人工;
3. 原创的高速内核: 自主开发的浏览器内核,速度极快,远远超过对手;
4. 智能识别: 可以智能识别网页中的列表和表单结构(多选框下拉列表等);
5. 广告屏蔽: 自定义广告屏蔽模块,与AdblockPlus语法兼容,可以添加自定义规则;
6. 各种数据导出: 支持Txt,Excel,MySQL,SQLServer,SQlite,Access,网站等.
核心技术
1. 自动识别列表数据,并通过智能算法一键提取数据;
2. 自动识别寻呼技术,智能识别算法,采集寻呼数据;
3. 混合浏览器引擎和HTTP引擎,同时考虑到易用性和效率.
使用方法
一个: 输入采集网址
打开软件,创建一个新任务,然后输入需要采集的网站地址.
二: 智能分析,在整个过程中自动提取数据
进入第二步后,优采云采集器会自动对网页进行智能分析,并从中提取列表数据.
三: 将数据导出到表,数据库,网站等
运行任务,将采集中的数据导出到表,网站和各种数据库中,并支持api导出.
计算机系统要求
可以支持Windows XP以上的系统.
.Net 4.0 Framework,下载链接
安装步骤
第一步: 打开下载的安装包,然后选择直接运行它.
步骤2: 收到相关条款后,运行安装程序PashanhuV2Setup.exe. 安装
第3步: 然后继续单击“下一步”,直到完成为止.
步骤4: 安装完成后,您可以看到优采云采集器V2主界面的主界面
常见问题解答
1. 如何采集移动版网页的数据?
在通常情况下,网站具有网页的计算机版本和网页的移动版本. 如果对计算机版本(PC)网页的反爬网非常严格,我们可以尝试对移动网页进行爬网.
①选择创建新的编辑任务;
②在新创建的[编辑任务]中,选择[步骤3,设置];
③将UA(浏览器标识)设置为“手机”.
2. 如何手动选择列表数据(自动识别失败时)
在采集列表页面中,如果列表的自动识别失败,或者所识别的数据不是我们认为的数据,那么我们需要手动选择列表数据.
如何手动选择列表数据?
①单击[全部清除]清除现有字段.
②单击菜单栏中的[列表数据],选择[选择列表]
③使用鼠标单击列表中的任何元素.
④单击列表另一行中的相似元素.
在通常情况下,采集器将自动枚举列表中的所有字段. 我们可以对结果进行一些更改.
如果未列出字段,则需要手动添加字段. 单击[添加字段],然后单击列表中的元素数据.
3. 对于采集文章文字,如果鼠标无法选择全部内容该怎么办?
通常,在优采云采集器中,用鼠标单击以选择要捕获的内容. 但是,在某些情况下,例如当您想获取文章的完整内容时,当内容很长时,有时很难找到鼠标.
①我们可以通过右键单击网页并选择[检查元素]来找到内容.
②通过单击[向上]按钮来放大所选内容.
③扩展到我们的全部内容时,选择所有[XPath]并复制.
④修改字段的XPath,粘贴到刚刚复制的XPath中,然后确认.
⑤最后,修改值属性. 如果需要HMTL,请使用InnerHTML或OuterHTML.
软件特别说明
360安全卫士用户注意: 由于360软件的错误警报,单个文件(包括uninst.exe)被删除,导致程序无法正常运行,请在退出之前退出360软件安装