dedecms自带了文章和图片采集功能,你知道吗?

优采云 发布时间: 2021-05-06 07:38

  dedecms自带了文章和图片采集功能,你知道吗?

  如果您想从其他站点重新打印文章,则无需来回复制。 dede cms带有文章和picture 采集函数。对于不熟悉它的人,可以配置采集规则。这很麻烦,并且经常在采集中犯错或出现乱码。现在,我将向您介绍dede cms的采集函数。

  1打开新节点菜单,打开后台-> 采集-> 采集节点管理,单击以添加新节点

  

  2选择型号

  

  3新节点-配置URL索引以填写采集的网站列表的相关规则,

  

  4要查看采集站点的代码和网站的源代码,请右键单击并单击以查看源代码,在源代码的开头,找到一个具有charset = a的元标记代码,例如charset =“ gb2312”,这是第二步中提到的网站编码

  

  5个新的节点配置文章 URL匹配规则。我们检查采集网站列表页面的源代码,找到文章列表的起始html和结束html标签,然后复制它们以添加采集节点-> 文章 URL匹配规则的“区域”和“该区域末尾的HTML”输入框。您不必选择右键单击以查看源代码以找到文章列表的开始标记,您可以右键单击文章的开头以查看元素(chrome浏览器,firefox是查看元素),这样现在可以更方便地找到文章列出开始和结束标签。设置完成后,我们点击“保存信息并输入下一个设置”

  

  6 URL获取规则测试如果测试结果中发现不相关的URL信息,则说明第五步中的URL过滤规则错误或未填写过滤规则。如果发现采集为错误,您可以返回上一次修改,否则请单击“保存信息并输入下一个设置”。

  

  7内容字段获取规则。我们检查采集网站的文章源代码,找到相关选项的开始和结束html标签,填写指定位置,并将开始和结束标签除以“ [内容]”。设置完成后,我们点击“保存配置并预览”

  

  8过滤规则在第七步的匹配规则之后,有一个过滤规则,该过滤规则用于过滤不需要的内容采集。例如,网易的每篇文章文章都有一个iframe标签来放置广告。我们需要采集网易的文章。 采集回来后,就无法逐条删除此广告帖子。但是如何将其删除?删除方法是过滤规则。当我们单击通用规则时,将弹出一个小窗口,列出通用过滤规则。我们只需要单击要过滤的规则。过滤网易文章在iframe标签中,我们只需单击iframe。

  

  9测试内容字段设置,因为网易开头是文章

  ,某些文章开头

  ,因此采集中将出现错误。如果现在要采集,则可以单击保存,然后单击采集。在这里,我选择仅保存

  

  10 采集内容(一)返回到采集节点管理界面,这是第一步中的界面,我们选择节点并单击采集

  

  11 采集内容(二)

  

  12要查看下载的文件,可以单击采集界面(步骤10中的界面)右上角的“查看下载的内容”。您也可以在“ 采集节点管理”界面中单击“查看已下载”。以第二种方法为例。

  

  13导出内容,选​​择要导入的列,数据量,是否生成html文件以及随机推荐的数量

  

  14个最终结果

  

  对于学习电子商务网络营销的学生,您应该知道dede cms是一个简单,健壮,灵活且开源的开源内容管理系统。它是国内开源cms领先品牌。

  1首先安装环境(下载dede cms官方网站,我介绍了一个非常好的软件“ wampserver”,具有自己的数据库)

  2-pack dede cms

  3在Dede cms -V 5. 7-UTF8-1中打开上传并复制其中的所有文件

  4粘贴到根目录www

  5在浏览器中输入IP地址(12 7. 0. 0. 1),您可以输入

  wampserver确实是一个特别好的软件,您可以尝试

  如果在此计算机上安装了此类软件,则必须先将其卸载

  请勿使用360进行卸载。首先找到软件的详细信息,然后打开此文件夹,在该文件夹中找到unins,然后可以将其卸载,请记住在卸载后删除此文件夹

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线