设置篇

优采云 发布时间: 2020-08-09 14:09

  创建新方案后,在方案窗口左侧的方案设定县进行方案设置;

  

  1、选择规则;

  一个方案由采集规则、中间规则、发布规则组合而成,这两者是互相独立,又是互相关联的,通过不同的搭配,能组合出实现各类采集目标的方案,见图示3:

  

  (图示3)

  当所选规则有关键项未设置时,将弹出提示;

  点击规则选框旁的小图标,可以快捷步入规则配置窗口;

  注:改变方案的采集规则会导致该方案的未发布文章记录被手动删掉。

  2、方案执行次数

  方案在手动工作时,每天的执行总次数,设为0则不限制,见图示:

  

  通过本项与手动文章发布数配合,可以控制方案每晚发布的文章数量。

  3、文章发布数

  在手动工作时,每一次执行方案所容许发布成功的最大文章数量,设为0则不限制,见图示:

  

  通过本项与手动执行次数配合,可以控制方案每晚发布的文章数量。

  4、采集间隔;

  用于控制采发节奏,很多网站尤其是峰会类都对一定时间内的回帖次数有限制,如果用户未在插口中取消这个限制,则须要用采集间隔时间来控制采发节奏,以保证不会被网站程序拒发文章,同时,也控制采发速率,采集间隔以秒为单位,见图示4:

  

  (图示4)

  5、发布次序;

  这是一个发布时的容错机制,通过三个选项的组合,控制数据发布与文件上传,见图示5:

  

  (图示5)

  先发布文章:选中此项,发布时,先发布各数据项,成功后再上传文件;

  先上传文件:选中此项,发布时,先上传文件,成功后再发布各数据项;

  6、重复检测范围;

  勾选此项时,ET内部数据库文章重复检测仅在同一方案中进行,若本地数据库中有文章与采集目标相同,而所属方案不同,仍执行采集,见图示7:

  

  (图示7)

  7、文章本地检测模式;

  优采云采集器文章列表时,会现依照预设模式检测是否与ET内部数据库已采集文章重复,如果重复,则不会再度采集,下图中的四个选项则拿来控制检测模式,见图示6:

  

  (图示6)

  不检测重复:选中时,不在ET内部数据库做文章是否重复检查;

  按网址检测:选中时,若内部数据库存在与采集目标网址相同的文章条目,则系统判断文章重复,不予采集,此项受‘仅限本方案’选项影响;

  按标题检测:选中时,若内部数据库存在与采集目标标题相同的文章条目,则系统判断文章重复,不予采集,此项受‘仅限本方案’选项影响;

  网址和标题:选中时,只有在内部数据库存在与采集目标网址、标题同时相同的文章条目,系统才判断文章重复,不予采集,此项受‘仅限本方案’选项影响;

  8、不保存记录

  启用本项,将不保存发布成功的文章到已发布文章列表,选项见图示:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线