Hive数据平台(Web内容采集和分析工具)v1.6最新免费版本
优采云 发布时间: 2020-08-06 16:08Hive数据平台是一种实用的软件,可以采集和分析Web数据. 强大的内容采集和数据导入功能可以帮助您轻松完成Web数据的分析和采集,并且该软件易于操作,可以应用在各个行业中,欢迎需要下载和使用当易的朋友.
软件简介:
Honeycomb Data是一个简单而灵活的网页采集和分析软件. 您只需要编写一个简单的JavaScript脚本即可从任何网页采集数据. 例如简历采集,竞争对手分析,行业动态跟踪等.
使用方法:
1. 打开软件后,单击工具栏上的“新建任务”,将弹出“新建任务”对话框. 输入任务名称“第一个任务”,然后单击“保存”. 您已经成功创建了第一个数据采集任务.
2. 首先,我们首先定义数据表. 单击任务编辑器下的“数据字段”选项卡. 我们添加两个字段,“标题”和“内容”
3. 接下来,我们需要编写一小段JavaScript代码来执行任务. 要编写采集任务,只需要简单的JavaScript语法. 将以下JavaScript代码复制到脚本编辑器,然后单击“运行”,稍等片刻,您将在“数据”字段面板中看到采集的数据.
/ *加载需要采集的页面* / load(“”); / *提取我们需要的数据* /
t = inner_text(“ obj1”); c = inner_text(“ / html / body [1] / div [1]”); / *将数据保存到数据库中* / save([t,c]);
4. 到目前为止,我们已经在调试模式下运行了脚本,并且数据不会在调试模式下保存到数据库中. 单击工具栏上的“保存”,选择“第一个任务”,然后单击“启动任务”,该任务现在正在工作模式下运行. 任务完成后,单击“查看数据”,我们将在新窗口中看到任务采集的数据.
更新日志:
1. 修复任务列表显示错误
2. 修复副本XPath格式错误