文章采集规则(dedecms采集教程之dedecms的采集规则介绍(图))

优采云 发布时间: 2021-11-06 01:01

  文章采集规则(dedecms采集教程之dedecms的采集规则介绍(图))

  很多朋友在使用DEDEcms的时候,总会想到采集。事实上,我不提倡这样做。这无异于自掘坟墓,但我还是把>dedecms采集规则分享给大家,仅供参考。

  下面开始dedecms采集教程的讲解。我们已经解释了dedecms的采集规则。

  第一步是确定采集的网站

  第二步,确定站号为采集。通过采集打开网页后,查看源码(IE:查看->源码)

  

  

  找到中间的字符集,后面会显示网页的编码,截图是“gb2312”

  第三步,采集列表获取规则编写

  源网址写的很明显,pageno是指页码,所以如果有多页列表采集,需要用“[var:分页]”替换页码,截图如下

  

  

  文章URL必须收录URL,不能收录这两个。通常,您不需要编写它。当采集的列表范围内有很多不需要的链接时,用于过滤。

  上面的网址没有收录为什么要加在前面的原因,就不多说了。

  如果只有一个列表页,那么直接在源URL中写URL就可以了。

  

  

  注意这个,最重要的就在这里。

  以下是“采集获取文章列表的规则”,

  上面是采集打开的页面的源代码文件,在找到文章的列表之前,没有其他代码和这个页面一样

  在德德官网cms文章的列表页,列表前后不一样的是“>”和“>”,写“开始HTML”和“结束HTML”,编写方法见截图(责任编辑:admin)

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线