云优cms文章采集(帝国7.2后台CMS采集代码采集规则教程(1)(组图))

优采云 发布时间: 2022-03-29 02:06

  云优cms文章采集(帝国7.2后台CMS采集代码采集规则教程(1)(组图))

  帝国7.2后台采集云服务器的过滤替换技巧怎么样?云服务器值不值得买?云服务器好不好?

  

  在之前的VPS主机评测中,讲过7.2后台cms采集code采集的规则编写教程。本次文章VPS主机评测主要介绍帝国cms采集过滤替换,以及一些技巧,VPS主机评测记录就到这里,希望对有需要的站长有所帮助!

  VPS主机评测三帝后台采集教程系列

  Empire7.2 后台cms采集代码采集规则编写教程 Empire7.2 后台采集过滤替换技巧 Empirecms 7.2如何采集内容分页教程

  一、过滤

  1、Empirecms采集过滤分为两种:

  (1)"整体页面过滤规则":

  (2)"广告过滤器":

  我们有点疑惑,这两种过滤有什么区别?“整页过滤规则”是过滤整个网页的html代码。“过滤广告常规”是过滤 文章 内容,它只适用于 文章 内容([!--newstext--])。

  2、过滤器示例:

  过滤器实例 (1):

  在我们采集之后,发现消息内容底部多了一行代码:"

  &bnsp;

  ”,根据格式“ad start [!--ad--] ad end”得到“过滤广告规则”:

  过滤器实例 (2):

  过滤链接代码怎么做,注意“过滤广告规则”右边的那一堆代码:

  先用鼠标点击A,系统会自动生成过滤链接代码“,,”,这样就可以过滤掉采集之后的内容链接。同理,如果要过滤其他html代码,点击对应的标签代码即可。

  注意:当内容分页收录在内容中时([!--newstext--]),要过滤掉内容分页,否则会重复出现内容分页。

  二、替换

  1、Empirecms采集替换也分为两种:

  (1)"整页替换":

  (2)"替换":

  它们之间有两个区别:“整页替换”是替换整个网页的html代码。“替换”是替换 文章 标题和内容,仅适用于标题 ([!--title--]) 和 ([!--newstext--])。

  2、替换示例:

  我们需要将内容中的“新华网”替换为“CDC”:

  预览下:

  没问题,换了。

  三、图片采集

  (1)当我们采集时,信息的内容可以正常采集,但是里面的图片是不显示的,例如:

  信息内容可以正常采集,即不显示图片。这是因为内容图片的路径不对,图片的路径是相对地址。

  (2)查看源码:

  图片是相对地址,必须换成绝对地址才能采集成功。

  (3) 被替换为绝对地址:

  首先在目标站的图片上右键查看属性:

  目标站的图片地址为“”,我们采集到达的图片地址为“/news/PNews/a/e77366_6346550.jpg”,前缀为“***.com”通过分析得到,我们将前缀放在“图片/FLASH地址前缀(内容)”中,如下图:

  (4)前台预览图:

  这个图片显示着:

  查看源代码:

  图片地址正确,是本地地址。

  注意:当我们在本地采集预览和暂存信息时,发现已经添加了图片地址前缀,但是图片还是没有显示出来。图像地址前缀将被自动添加。

  这仍然非常有用。VPS主机评测找了很久的替代品,但还是有一些基础功能没有介绍清楚。可以去帝国官方网站看基础教程。

  

  来源链接:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线