设置篇
优采云 发布时间: 2020-08-09 14:09创建新方案后,在方案窗口左侧的方案设定县进行方案设置;
1、选择规则;
一个方案由采集规则、中间规则、发布规则组合而成,这两者是互相独立,又是互相关联的,通过不同的搭配,能组合出实现各类采集目标的方案,见图示3:
(图示3)
当所选规则有关键项未设置时,将弹出提示;
点击规则选框旁的小图标,可以快捷步入规则配置窗口;
注:改变方案的采集规则会导致该方案的未发布文章记录被手动删掉。
2、方案执行次数
方案在手动工作时,每天的执行总次数,设为0则不限制,见图示:
通过本项与手动文章发布数配合,可以控制方案每晚发布的文章数量。
3、文章发布数
在手动工作时,每一次执行方案所容许发布成功的最大文章数量,设为0则不限制,见图示:
通过本项与手动执行次数配合,可以控制方案每晚发布的文章数量。
4、采集间隔;
用于控制采发节奏,很多网站尤其是峰会类都对一定时间内的回帖次数有限制,如果用户未在插口中取消这个限制,则须要用采集间隔时间来控制采发节奏,以保证不会被网站程序拒发文章,同时,也控制采发速率,采集间隔以秒为单位,见图示4:
(图示4)
5、发布次序;
这是一个发布时的容错机制,通过三个选项的组合,控制数据发布与文件上传,见图示5:
(图示5)
先发布文章:选中此项,发布时,先发布各数据项,成功后再上传文件;
先上传文件:选中此项,发布时,先上传文件,成功后再发布各数据项;
6、重复检测范围;
勾选此项时,ET内部数据库文章重复检测仅在同一方案中进行,若本地数据库中有文章与采集目标相同,而所属方案不同,仍执行采集,见图示7:
(图示7)
7、文章本地检测模式;
优采云采集器文章列表时,会现依照预设模式检测是否与ET内部数据库已采集文章重复,如果重复,则不会再度采集,下图中的四个选项则拿来控制检测模式,见图示6:
(图示6)
不检测重复:选中时,不在ET内部数据库做文章是否重复检查;
按网址检测:选中时,若内部数据库存在与采集目标网址相同的文章条目,则系统判断文章重复,不予采集,此项受‘仅限本方案’选项影响;
按标题检测:选中时,若内部数据库存在与采集目标标题相同的文章条目,则系统判断文章重复,不予采集,此项受‘仅限本方案’选项影响;
网址和标题:选中时,只有在内部数据库存在与采集目标网址、标题同时相同的文章条目,系统才判断文章重复,不予采集,此项受‘仅限本方案’选项影响;
8、不保存记录
启用本项,将不保存发布成功的文章到已发布文章列表,选项见图示: