文章cms采集(新浪各地新闻栏目为帝国cms进行实战采集功能详解!)
优采云 发布时间: 2022-01-03 11:16文章cms采集(新浪各地新闻栏目为帝国cms进行实战采集功能详解!)
Empirecms 是一个网站建设系统,我们使用的不仅仅是 PHP。在建网站的过程中,如果没有信息源,只能靠人工反复复制粘贴,费时费力,所以我们将利用Empirecms的采集功能来完成信息录入。为了进一步了解帝国cms采集的特点,我们以“新浪新闻”栏目为例进行实战采集。 一、添加采集节点1、添加节点:2、选择要添加的列采集:3、输入添加节点形式:4、在节点名称框中输入名称,复制你想要的新浪新闻列表地址采集:5、 下来,找到很多选项,比如“采集@ > 页面地址方法二,内容页面地址前缀...”先不理他,后面再详细解释,直接拉到“常规信息链接区”这里:6、这里是列表信息链接区采集的常规设置,我们点击查看来自新浪各地的新闻列表。 《源文本7、将源文件代码复制到Dreamweaver中,在Dreamweaver中选择信息链接区到采集:8、切换到Dreamweaver代码模式,就是信息链接区:< @9、 获取信息链接区规则:10、 获取信息页链接规则:11、 注:如果信息页链接是相对地址,例如“内容页添加一个域名到“地址前缀”:12、现在采集内容页的标题和内容:13、查看新闻页的“源文件”,找到标题标签:14、获取标题规律:15、这里是采集的内容区域:16、获取新闻内容规律:(注意:d_id新闻内容正则化中的=„*'使用通配符,因为每条新闻的d_id值不同,所以可以用*代替,“*”可以代替任意字符。
) 17、点击提交按钮完成整个采集节点:二、预览采集节点是否正确1、提交按钮并返回管理节点:2、点击“预览”采集,进入节点预览结果:3、采集内容页面列表4、采集内容页页面:三、采集1、预览采集节点无误后,返回“管理节点”,点击“开始采集”启动链接采集:2、系统在采集:3、采集 完成后会显示本地暂存信息。此时可以修改或删除暂存信息:4、修改信息页面如图:5、查看采集的信息并存入,点击“存储所有信息按钮”:6、 确认操作:7、信息录入库完成提示:信息存储到库后,点击“管理信息”:我们可以看到新闻刚刚存储的信息采集:最后,进入“数据更新”刷新首页、栏目、内容页,再次完成网站的信息采集。由于Empire cms 采集 的功能非常强大,我一时说不完。下一讲会继续讲解其他函数的使用和技巧。本文由作者整理,转载请保留链接,谢谢! 13 1414