动易SiteFactory采集流程第一步

优采云 发布时间: 2020-08-27 03:46

  动易SiteFactory采集流程第一步

  本节将以采集动易官方网站“公司动态”栏目为例讲解添加采集项目并进行信息采集的*敏*感*词*。

  如果您第一次接触采集功能,请认真阅读操作步骤及并理解相关说明,按以下步骤一一操作以完善所需采集的项目。

  14.2.1 第一步:采集项目设置

  依次点击“内容管理”->“采集管理”->“采集管理”功能链接,在出现的管理界面中,单击两侧管理操作导航中“添加采集项目”功能链接,系统出现“添加采集项目设置”管理界面,以设置所需新建的采集项目的名称、采集网站、编码等基本设置信息。

  

  重要参数说明:

  ·项目名称:填写自定义采集项目的名称(如“动易公司动态”)。

  ·对应本站栏目:点选设置所采集的数据保存到本站所对应的栏目节点名(如“文章中心”)。

  ·对应内容模型:点选设置对应栏目的模型(如“文章模型”)。

  

  温馨提示:若后续在采集项目完成后,再修改了所对应的模型,系统将手动删掉采集第三步所有数组的规则。

  ·采集网站:填写所需采集目标网站的名称(如“动易官网”)。

  ·采集URL:填写采集网页的网址(以 开头,如“”)。

  ·编码选择:提供GB2312、UTF-8和Big5三种编码格式。国内的网站基本都是GB2312,若采集香港、台湾的网站请选择Big5编码,若采集海外网站则选择UTF-8编码(如“动易技术中心”选择“GB2312” 编码)。

  ·指定采集数量:指定采集的数目,不指定为采集全部数据。

  ·采集顺序:设置按升序或乱序形式进行采集(系统默认为逆序采集)。

  ·采集简介:填写本采集项目的简略介绍信息(如“动易官方网站动易公司动态信息”)。

  设置好相关选项后,单击页面顶部“下一步”功能按键进行采集列表项目信息设置。

  

  温馨提示:若目标网站的信息须要登陆后才可查阅与采集,请参阅动易技术中心中的相关说明以进行设置。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线