文章cms采集(帝国cms采集过滤与替换,还有些技巧(图))

优采云 发布时间: 2022-02-22 07:00

  文章cms采集(帝国cms采集过滤与替换,还有些技巧(图))

  相关文章:帝国cms采集功能:采集新浪新闻栏目内容

  Empirecms采集教程:Empirecms采集内容分页教程

  上一讲主要介绍Empirecms采集过滤替换,以及一些技巧。

  一、过滤器

  1、Empirecms采集有两种过滤方式:

  (1)"整体页面过滤规则":

  

  (2)“过滤广告”:

  

  我们有点困惑,这两个过滤器有什么区别? “整页过滤规则”是过滤整个网页的html代码。 “过滤广告常规”是过滤文章内容,只对文章内容有效([!--newstext--])。

  2、过滤器实例:

  过滤实例(1):

  

  在我们采集之后,发现消息底部多了一行代码:“

  &bsp;

  ”,根据格式“ad start [!--ad--] ad end”得到“过滤广告规则”:

  

  过滤实例(2):

  

  要怎么过滤链接代码,注意“Filter Ad Regular”右边那堆代码:

  

  先点击A,系统会自动生成过滤链接代码“,,”,这样就可以过滤掉采集之后的内容链接。同理,如果要过滤其他html代码,点击对应的tag代码即可。

  注意:当内容中收录内容分页时([!--newstext--]),要过滤掉内容分页,否则会重复出现内容分页。

  二、替换

  1、帝国cms采集替换也分为两种:

  (1)"整页替换":

  

  (2)"替换":

  

  它们有两个区别:“整页替换”就是替换整个网页的html代码。 “替换”是替换文章标题和内容,只对标题([!--title--])和([!--newstext--])有效。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线