文章cms采集(帝国cms采集过滤与替换,还有些技巧(图))
优采云 发布时间: 2022-02-22 07:00文章cms采集(帝国cms采集过滤与替换,还有些技巧(图))
相关文章:帝国cms采集功能:采集新浪新闻栏目内容
Empirecms采集教程:Empirecms采集内容分页教程
上一讲主要介绍Empirecms采集过滤替换,以及一些技巧。
一、过滤器
1、Empirecms采集有两种过滤方式:
(1)"整体页面过滤规则":
(2)“过滤广告”:
我们有点困惑,这两个过滤器有什么区别? “整页过滤规则”是过滤整个网页的html代码。 “过滤广告常规”是过滤文章内容,只对文章内容有效([!--newstext--])。
2、过滤器实例:
过滤实例(1):
在我们采集之后,发现消息底部多了一行代码:“
&bsp;
”,根据格式“ad start [!--ad--] ad end”得到“过滤广告规则”:
过滤实例(2):
要怎么过滤链接代码,注意“Filter Ad Regular”右边那堆代码:
先点击A,系统会自动生成过滤链接代码“,,”,这样就可以过滤掉采集之后的内容链接。同理,如果要过滤其他html代码,点击对应的tag代码即可。
注意:当内容中收录内容分页时([!--newstext--]),要过滤掉内容分页,否则会重复出现内容分页。
二、替换
1、帝国cms采集替换也分为两种:
(1)"整页替换":
(2)"替换":
它们有两个区别:“整页替换”就是替换整个网页的html代码。 “替换”是替换文章标题和内容,只对标题([!--title--])和([!--newstext--])有效。