ET使用方法之采集文章的栏目分类手动匹配

优采云 发布时间: 2020-08-13 20:45

  虽然一个方案对应一个发布栏目是最准确的方法,但有些用户不希望构建多个方案,来分别对应自己网站的各个栏目。

  这里述说一个ET的使用方法,通过它,可以在一个方案中向不同的栏目手动发布适宜的文章。

  一些目标网站不同栏目、分类的文章,它们的版式一样,我们如下操作可以将它们手动对应到我们的网站不同 的栏目中:

  1、在采集规则-列表网址里填上多个栏目的网址,也可以是一个收录多个栏目/分类文章的列表网址;

  2、在采集规则中构建一个新数据项,譬如我们可以起名为“栏目名称”,并在采集页中关联它,见图示1;

  

  (图示1)

  3、用这个“栏目名称”数据项去采集目标文章中的分类名称或标示作为它的值,见图示1;

  4、建立这个“栏目名称”数据项的专用数据整理组,并和“栏目名称”数据项关联,见图示1;

  5、设置这个数据整理组,将“栏目名称”数据项采集到的每一个可能的值,替换为用户自己网站的对应栏目真实ID,见图示2;

  

  (图示2)

  如果采集到的“栏目名称”中还包括其他多余字符,那么可以用变量标记进行匹配替换,见图示3:

  

  (图示3)

  如果有匹配不到的情况,即设置的栏目关键词不足以涵盖对方所有内容,我们可以用不等式标记将未匹配到的内容统一替换为指定ID,如图示4。

  该条规则的作用是,经过前面几条整理规则处理后的数据项的值不等于21、22、23时,将数据项的值替换为2。

  

  (图示4)

  6、在发布规则-发布项-参数取值中,添加或更改“栏目ID”参数名(栏目ID参数名见插口说明)的值为“栏目名称”数据项,见图示5;

  

  (图示5)

  至此,当我们采集文章时,通过数据整理,就会将手动的将文章对应到我们发布目的网站的各个栏目中了。

  注:发布规则-检查网址栏不支持使用【文章标题】标记外的任何内部标记,即不能在此调用标题之外的数据项,因此不能通过上述方式手动匹配栏目,建议留空栏目ID参数的值以在全站检测重复(是否支持栏目ID参数留空请看插口说明书)

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线