优采云采集器下载地址
优采云 发布时间: 2020-08-06 18:24
优采云采集器是适用于大多数网站的网页信息采集软件. 优采云采集器可以实现智能识别,快速采集和多格式数据输出的效果,满足您在指定网页上进行数据采集的需求. 需求.
软件功能
1. 一键式数据提取: 简单易学,通过可视界面,只需单击鼠标即可获取数据.
2. 快速高效: 内置一组高速浏览器内核以及HTTP引擎模式,可实现快速数据采集.
3. 适用于各种网站: 它可以采集99%的Internet网站,包括单页应用程序,Ajax加载和其他动态网站.
4. 有许多类型的导出数据. 采集的数据可以导出到Csv,Excel和各种数据库,并且支持api导出.
软件功能
1. 向导模式: 简单易用,鼠标点击即可轻松生成;
2. 脚本定期运行: 可以按计划定期运行,无需人工;
3. 原创的高速内核: 自主开发的浏览器内核,速度极快,远远超过对手;
4. 智能识别: 可以智能识别网页中的列表和表单结构(多选框下拉列表等);
5. 广告屏蔽: 自定义广告屏蔽模块,与AdblockPlus语法兼容,可以添加自定义规则;
6. 各种数据导出: 支持Txt,Excel,MySQL,SQLServer,SQlite,Access,网站等.
核心技术
1. 自动识别列表数据,并通过智能算法一键提取数据;
2. 自动识别和寻呼技术,通过算法智能识别和采集寻呼数据;
3. 考虑到易用性和效率,混合浏览器引擎和HTTP引擎.
使用方法
一个: 输入采集网址
打开软件,创建一个新任务,然后输入要采集的网站地址.
二: 智能分析,在整个过程中自动提取数据
进入第二步后,优采云采集器会自动智能地分析网页并从中提取列表数据.
三: 将数据导出到表,数据库,网站等
运行任务,将采集的数据导出到表,网站和各种数据库中,并支持api导出.
计算机系统要求
可以支持Windows XP以上的系统.
.Net 4.0 Framework,下载链接
安装步骤
第一步: 打开下载的安装包,然后选择直接运行它.
步骤2: 收到相关条款后,运行安装程序PashanhuV2Setup.exe. 安装
第3步: 然后继续单击“下一步”,直到完成为止.
第4步: 安装完成后,您可以看到优采云采集器 V2主界面的主界面
常见问题解答
1. 如何从网页的移动版本中采集数据?
在通常情况下,网站具有计算机版本和移动版本. 如果PC版本的反抓取非常严格,我们可以尝试抓取移动页面.
①选择创建新的编辑任务;
②在新创建的[编辑任务]中,选择[步骤3,设置];
③将UA(浏览器标识)设置为“手机”.
2. 如何手动选择列表数据(自动识别失败时)
在采集列表页面时,如果列表的自动识别失败,或者所识别的数据不是我们认为的数据,那么我们需要手动选择列表数据.
如何手动选择列表数据?
①单击[全部清除]以清除现有字段.
②单击菜单栏中的[列表数据],选择[选择列表]
③使用鼠标单击列表中的任何元素.
④单击列表另一行中的相似元素.
在通常情况下,采集器此时将自动枚举列表中的所有字段. 我们可以对结果进行一些更改.
如果未列出字段,则需要手动添加字段. 单击[添加字段],然后单击列表中的元素数据.
3. 如果在采集文章文本时无法用鼠标选择全部内容,该怎么办?
在通常情况下,在优采云采集器中,用鼠标单击以选择要捕获的内容. 但是在某些情况下,例如当您想获取文章的完整内容,内容很长时,有时很难找到鼠标.
①我们可以通过右键单击网页并选择[检查元素]来找到内容.
②通过单击[向上]按钮来放大所选内容.
③扩展到我们的全部内容时,选择所有[XPath]并复制.
④修改字段的XPath,粘贴到刚复制的XPath中,然后确认.
⑤最后,修改值属性. 如果需要HMTL,请使用InnerHTML或OuterHTML.