dedecms自动采集更新伪原创插件高级版57(教程简易采集我们内容网址如果作者V5.3(组图))
优采云 发布时间: 2021-11-20 22:02dedecms自动采集更新伪原创插件高级版57(教程简易采集我们内容网址如果作者V5.3(组图))
关键词说明:简单教程采集 我们的内容网址 如果作者V5.3
德德cms V5.3 采集 基础教程。
首先要说明的是,这是我第一次写这种教程。请原谅我的任何不当之处。
输入文字:
采集的过程其实就是复制的过程,但是我们复制的是显示结果,而采集主要是为了源码。
第一步,建立节点
我们以图片中的网址为例。必须正确选择目标页面编码,否则采集返回的内容会出现乱码。如果采集返回的内容是乱码,首先要考虑的是编码问题。这里我们选择utf-8,怎么知道别人的编码是什么?看源码就明白了。
“区域匹配模式”我选择正则表达式,因为如果选择“字符串”,会出现一些无法过滤掉的广告代码。
第二步:文章 URL匹配规则。欢迎来到生活小贴士 ()
这个要看采集网站的源码(图2),找一个收录所有内容URL的代码为采集(要唯一,建议使用 Ctrl F) ,这样我们就确定了 采集 区域的 URL,如果不放心,测试一下。
图2
最终结果如图 3 所示。
图 3
第三步:在前面两步的基础上,我们已经找到了需要采集的网站,下面我们来看看采集的具体内容。
在内容配置选项中,如果你偷懒的话,可以不要像我一样选择那么多的选项,只选择你感兴趣的部分,比如文章标题、作者和出处等,在dede cms V5.3修改了dede V5.1的规则,方便初学者使用。它的基本形式是将标签和内容放在一起。V5.1 requires 其实,划分开始标签和结束标签的原理是一样的。
下面说说自定义作者的问题。在之前版本的v5.3采集中,可以通过@me="Author"的形式自定义作者,但是v5.3只能通过替换来实现,of当然,也有不便之处。地方,这样我们就确定了基础。
第四步:这就是我们想要的内容的核心。这里会用到更多的过滤规则。幸运的是,dede V5.3 已经为我们准备了一些常用的,但是如果你想要采集 更复杂的网页,你必须学习一些常用的正则表达式。这样我们就基本学会了dedecms V5.3的采集,是不是有点简单?
夏客站长站()
第五步:导出内容,这个就不多说了。