云优cms采集插件(帝国CMS采集插件增加一个新的采集规则点击增加节点按钮)
优采云 发布时间: 2022-03-01 19:23云优cms采集插件(帝国CMS采集插件增加一个新的采集规则点击增加节点按钮)
Empirecms采集其实很简单,使用Empirecms采集插件即可。这是 7.0 的示例
进入Empirecms后台,选择“Columns”菜单,在左侧菜单中选择“采集Management”
打开管理采集节点
可以看到所有现有的 采集 规则节点
让我们开始添加一个新的 采集 规则
单击添加节点按钮
中间提示选择要创建的栏目点击你要创建的栏目,比如国际新闻。嗯,点进去。出现的界面有第一个节点的名字,因为上面创建了国际新闻,填国际新闻父节点不用管(就是留空)
页面地址采集,一般选择新闻列表页面,在新浪国际新闻中复制即可,如国际新闻的地址,在地址栏复制即可。
采集页面地址方式2无需填写内容,页面地址前缀写为
图片/FLASH地址前缀(内容)~~~ 截取内容的介绍不用开始填写采集内容是正规的。这时候就需要看网页的源码了。
常规页面链接
标题图像是常规的,标题不是必需的。打开内容页面,打开刚才制作的大栏目中的文章。
正则副标题:~~~信息来源正则不写新闻正文正则:
好的提交!
看看有没有错误
点击“预览”采集进入节点预览结果:
采集内容页面列表
采集内容页面页面:
预览采集节点无误后,返回“管理节点”,点击“开始采集”链接启动进程采集
系统是 采集
采集完成后会显示本地暂存信息。此时可以修改或删除暂存信息。
查看采集的信息并放入仓库,点击仓库中所有信息的按钮
确定行动
信息存储完成提醒
信息存入数据库后,点击管理信息
我们可以看到新闻信息只是采集
至此,采集资料全部完成,帝国cms采集很强大,需要自己去探索。
注意:
一般采集小于2种情况:
1、列表页选择的采集区域不正确
2、详情页常规错误
可以通过逐项预览找到原因,基本上可以采集,包括伪静态。