内容 采集 软件(软件标签:蜂巢数据平台网页分析数据())

优采云 发布时间: 2021-09-02 12:05

  内容 采集 软件(软件标签:蜂巢数据平台网页分析数据())

  软件标签:Hive数据平台网页分析 Hive数据平台是一款可以采集分析网页数据的实用软件。强大的内容采集和数据导入功能,可以帮助您轻松完成对网页数据采集的分析,软件操作简单,适用于各行业。欢迎有需要的朋友到当易下载使用。

  软件介绍:

  Honeycomb Data 是一款简单灵活的网页采集 分析软件。你只需要编写一个简单的JavaScript脚本就可以在任何网页上实现数据采集。如简历采集、竞争对手分析、行业动态跟踪等

  使用方法:

  1. 打开软件后,点击工具栏上的“新建任务”,弹出新建任务对话框。输入任务名称“First Task”,然后单击“保存”。您已经成功创建了第一个 data采集task。

  

  2.首先,我们先定义数据表。单击任务编辑器下的“数据字段”选项卡。我们添加两个字段,“title”和“content”

  3. 接下来,我们需要编写一小段 JavaScript 代码来执行任务。要编写采集 任务,我们只需要知道一个简单的 JavaScript 语法。将下面的JavaScript代码复制到脚本编辑器中,然后点击运行,稍等片刻,你会在数据字段面板中看到采集的数据。

  /* 加载需要采集的页面*/ load(""); /* 提取我们需要的数据 */

  t = inner_text("obj1"); c = inner_text("/html/body[1]/div[1]"); /* 将数据保存到数据库*/ save([t, c]);

  4. 到目前为止,我们已经在调试模式下运行脚本,在调试模式下数据不会保存到数据库中。单击工具栏上的“保存”,选择“第一个任务”,然后单击“开始任务”,任务现在以工作模式运行。任务完成后,点击“查看数据”,我们将在新窗口中看到来自任务采集的数据。

  更新日志:

  1. 修复任务列表显示错误

  2.修复复制XPath格式错误

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线