汇总:2016-2017年帝国cms文章采集教程(1)
优采云 发布时间: 2020-10-23 13:032016-2017 Empirecms文章采集教程(1)
Empirecms是一个网站构建系统,我们使用越来越多的PHP。在网站建设过程中,如果您没有任何信息,则只能重复手动复制和粘贴,这既费时又费力,因此我们必须使用Empirecms随附的采集功能来完成信息输入。为了了解Empirecms采集的功能,我们以“新浪新闻”专栏为例进行实际战斗采集。一、添加采集节点1、添加节点:2、选择要添加的列采集:3、输入添加节点的形式:4、在节点名称框中输入名称,然后将采集的新浪新闻列表地址复制到此处:5、我发现了很多选择,例如“ 采集页面地址方法二,内容页面地址前缀...”,暂时忽略他,我将解释他们一个接一个,只需将其转到“常规信息链接区域”即可:6、这是为采集常规设置的列表信息链接区域,我们单击以查看新浪地区的新闻列表“来源7、将源文件代码复制到Dreamweaver中,在Dreamweaver中选择信息链接区域到采集:8、切换到Dreamweaver代码模式,这是信息链接区域:9、获取信息链接区域规则:10、获取信息页面链接规则:1 1、注意:例如,如果信息页面链接是相对地址,则“内容页面地址前缀”应添加域名:1 2、现在采集标题和内容内容页面的t:1 3、检查新闻页面“源文件”并找到标题标签:1 4、获取标题规则:1 5、这是采集的内容区域:1 6、获取新闻内容规则:(注意:新闻内容规则中的d_id =“ *”使用通配符,因为每个新闻文章的d_id值都不同,所以可以使用*替换它,而“ *”可以替换任何字符
)1 7、单击提交按钮以完成整个采集节点:二、预览采集节点是否正确1、提交按钮并返回到管理节点:2、单击“ Preview” 采集,输入节点预览结果:3、 采集内容页面列表4、 采集内容页面页面:三、采集 1、预览采集节点正确后,然后返回到“管理节点”,单击“启动采集”链接将启动采集:2、系统位于采集:3、 采集完成3、之后,采集将显示本地临时存储信息,然后可以执行临时存储信息。修改或删除:4、修改后的信息页面如图所示:5、查看采集的信息并将其存储在仓库中,单击“在所有信息中存储按钮”:6、确认操作:7、存储中的信息完成提示:将信息存储在数据库中后,单击“管理信息”:我们可以看到收录新闻的新闻信息st存储在采集中:最后,转到“数据更新”以刷新主页,列和内容页面以完成网站采集的信息。由于Empirecms采集非常强大,因此我暂时无法完成。下一个讲座将继续说明其他功能的用法和技术。本文的组织者,请保留链接以供转载,谢谢! 13 1414