智能采集发布器(帝国CMS采集插件亮点数据采集自动去重在优采云上爬取 )
优采云 发布时间: 2021-10-20 13:30智能采集发布器(帝国CMS采集插件亮点数据采集自动去重在优采云上爬取
)
Empirecms采集发布插件是Empirecms系统采集的消息,如果不勾选,这个插件可以直接添加到Empirecms@ >后台完美融入系统,方便用户实现各种功能。用户可以通过该插件一键将爬取、购买、创建的数据发布到Empirecms网站,非常方便。
Empirecms采集插件亮点
数据采集自动去重
在优采云上爬取的数据根据URL自动去重,也可以自定义去重的基础
自动数据发布
安装插件后,采集的数据可以一键自动发布到您的网站,可视化控制
正常运行,自动更新
支持定时运行采集任务,自动采集最新数据和更新旧数据
自动下载图片等文件
采集过程中可以开启文件云托管,自动下载图片/音视频等文件
伪原创/SEO 支持
发布前可以对数据进行链接和替换关键词,有助于伪原创和SEO优化
支持字段映射和帝国功能
兼容GBK和UTF8,支持发布到不同模块,可以设置文章权重等。
Empirecms采集插件安装步骤
1、插件下载后,使用FTP将文件上传解压到Empire的“e/extend/”目录下网站。如需更新插件,请先卸载旧版插件(卸载步骤请参考本章第2步安装插件步骤3、4),然后重新安装插件,安装方法一样
2、文件上传完成后,使用管理员账号登录帝国网站后台
3、在浏览器中打开安装网址(例如:你的网站是“”,需要访问“”)。进入安装页面,点击“同意”
4、要安装插件,请选择“安装”和“提交”
要卸载插件,请选择“卸载”和“提交”
5、在Empire backend的“Plugins”部分,可以看到“优采云”模块,说明优采云Empire release插件已经安装成功
6、打开插件,可以查看基本信息,修改发布密码等。
Empirecms采集插件数据发布教程
第一步登录优采云
登录优采云后,打开要发布的数据(可以在数据源管理或应用程序中打开)
第二步创建发布项
1、点击新帖子
2、选择数据库类型
3、输入数据库地址、端口、用户名和密码,连接数据库。注意一定是可以远程连接的数据库!
4、选择要发布到的数据库,设置发布到新表或现有表,选择数据库字符。点击下一步
注意:如果发布到新表,请确保填写的用户有创建表的权限
5、如果发布到已有表,需要进行字段映射,设置数据的哪些字段发布到已有表的哪些字段。发布到新创建的表会跳过这一步,不需要设置。点击下一步
注意:不要修改正在发布的数据库表名或字段名!否则会发布失败或自动新建表发布
6、 可设置内容预处理/SEO,统一修改后发布数据
注意:发布到数据库不支持链接替换,只支持关键词替换
第 3 步:手动或自动发布数据
方法一自动释放
1、 在发布数据页面,点击自动发布按钮,选择发布项目,开始自动发布
注意:
自动释放就是按照数据的先后顺序将数据一个一个地释放出来,并且可以随时停止释放;
开启自动发布后,进入发布状态;如果有数据发布,则进入休眠状态,继续发布,直到有新数据;
数据发布成功后,其状态将变为已发布。可以修改发布状态为未发布,数据会自动重新发布;
自动发布是优采云 Personal Ultimate及以上包的专属功能;
优采云账号下有多少个节点,就可以同时开启多少个自动发布。
2、查看自动发布日志,可以查看发布进度和发布结果
方法二手动单放
在数据页面,选择需要发布的数据,打开预览,点击发布数据。选择要发布的发布项目后,可以查看发布结果
注意:有时释放结果会显示:释放失败、返回数据异常或读取超时。这个不影响发布的结果,只要在后台能查到过去的数据就说明发布成功
方法三手动多次发布
在数据页面,选择需要发布的多条数据,点击多选发布。选择发布项后发布,可以查看每条数据的发布结果