dedecms自带了文章和图片采集功能,你知道吗?
优采云 发布时间: 2021-05-06 07:38dedecms自带了文章和图片采集功能,你知道吗?
如果您想从其他站点重新打印文章,则无需来回复制。 dede cms带有文章和picture 采集函数。对于不熟悉它的人,可以配置采集规则。这很麻烦,并且经常在采集中犯错或出现乱码。现在,我将向您介绍dede cms的采集函数。
1打开新节点菜单,打开后台-> 采集-> 采集节点管理,单击以添加新节点
2选择型号
3新节点-配置URL索引以填写采集的网站列表的相关规则,
4要查看采集站点的代码和网站的源代码,请右键单击并单击以查看源代码,在源代码的开头,找到一个具有charset = a的元标记代码,例如charset =“ gb2312”,这是第二步中提到的网站编码
5个新的节点配置文章 URL匹配规则。我们检查采集网站列表页面的源代码,找到文章列表的起始html和结束html标签,然后复制它们以添加采集节点-> 文章 URL匹配规则的“区域”和“该区域末尾的HTML”输入框。您不必选择右键单击以查看源代码以找到文章列表的开始标记,您可以右键单击文章的开头以查看元素(chrome浏览器,firefox是查看元素),这样现在可以更方便地找到文章列出开始和结束标签。设置完成后,我们点击“保存信息并输入下一个设置”
6 URL获取规则测试如果测试结果中发现不相关的URL信息,则说明第五步中的URL过滤规则错误或未填写过滤规则。如果发现采集为错误,您可以返回上一次修改,否则请单击“保存信息并输入下一个设置”。
7内容字段获取规则。我们检查采集网站的文章源代码,找到相关选项的开始和结束html标签,填写指定位置,并将开始和结束标签除以“ [内容]”。设置完成后,我们点击“保存配置并预览”
8过滤规则在第七步的匹配规则之后,有一个过滤规则,该过滤规则用于过滤不需要的内容采集。例如,网易的每篇文章文章都有一个iframe标签来放置广告。我们需要采集网易的文章。 采集回来后,就无法逐条删除此广告帖子。但是如何将其删除?删除方法是过滤规则。当我们单击通用规则时,将弹出一个小窗口,列出通用过滤规则。我们只需要单击要过滤的规则。过滤网易文章在iframe标签中,我们只需单击iframe。
9测试内容字段设置,因为网易开头是文章
,某些文章开头
,因此采集中将出现错误。如果现在要采集,则可以单击保存,然后单击采集。在这里,我选择仅保存
10 采集内容(一)返回到采集节点管理界面,这是第一步中的界面,我们选择节点并单击采集
11 采集内容(二)
12要查看下载的文件,可以单击采集界面(步骤10中的界面)右上角的“查看下载的内容”。您也可以在“ 采集节点管理”界面中单击“查看已下载”。以第二种方法为例。
13导出内容,选择要导入的列,数据量,是否生成html文件以及随机推荐的数量
14个最终结果
对于学习电子商务网络营销的学生,您应该知道dede cms是一个简单,健壮,灵活且开源的开源内容管理系统。它是国内开源cms领先品牌。
1首先安装环境(下载dede cms官方网站,我介绍了一个非常好的软件“ wampserver”,具有自己的数据库)
2-pack dede cms
3在Dede cms -V 5. 7-UTF8-1中打开上传并复制其中的所有文件
4粘贴到根目录www
5在浏览器中输入IP地址(12 7. 0. 0. 1),您可以输入
wampserver确实是一个特别好的软件,您可以尝试
如果在此计算机上安装了此类软件,则必须先将其卸载
请勿使用360进行卸载。首先找到软件的详细信息,然后打开此文件夹,在该文件夹中找到unins,然后可以将其卸载,请记住在卸载后删除此文件夹