工具采集文章(迅睿支持关键词泛采集(通过搜索引擎)安装优采云发布插件)
优采云 发布时间: 2021-09-20 18:48工具采集文章(迅睿支持关键词泛采集(通过搜索引擎)安装优采云发布插件)
导言和教程
平台的主要特点:
1.采集您不需要安装任何客户端,请单击“联机可视化”
2.集成了智能提取引擎(国内独家),可以自动识别数据和规则,包括翻页、标题、作者、发布日期、内容等,甚至可以不经修改启动采集
3.图片可下载存储到:阿里云OSS、七牛云、腾讯云;(支持水印、压缩等)
4.全自动:定时采集+自动释放
5.提供强大的搜索引擎优化工具,包括:文本插入动态段落(强烈推荐)、文本插入段落和标题自动关键词、自动内链、同义词替换、简单和繁体中文之间的转换、翻译等
6.与xunruicms系统无缝集成。只需点击几下,您就可以将其发布到xunruicmssystem
7.supports关键词pan采集(通过搜索引擎)
步骤1安装发布插件
在插件市场中安装优采云release插件(对用户xunruicms网站的操作,该插件基于xunruicmsV4.5.1(版本)
登录到xunruicms网站background,单击上面菜单中的[application]列,然后单击[application market],搜索[优采云采集],并在相应结果出现后单击下载
当您点击下载按钮时,系统会提示您输入xunruicmsofficial网站login的用户账号(如果没有,请先注册)
登录后,再次点击下载按钮进入安装页面-首先点击【导入程序】,然后点击【立即安装应用插件】-安装完成后,刷新页面
最后,单击上部菜单中的[application]列,然后单击左侧菜单中的[优采云采集release插件],进入配置页面。确保修改默认的发布密码等
二、Add发布目标
进入优采云控制台,在“我的采集tasks”列表中打开一个任务,进入采集task管理页面,找到【发布目标管理】,点击【更多cms】,点击【迅瑞cms】,在配置页面上填写基本信息并设置相应的发布字段,如下图所示:
三、xunruicms发布映射字段详细设置
发布到xunruicms时如何填写列ID@
优采云采集已发布到xunruicms并且暂时只支持文章模块
发布目标第二步设置的[column ID]对应值为xunruicmsbackground-->上菜单[content]–>左菜单[column management]-->,查看对应列的ID和模块
然后在发布目标的步骤2中填写映射字段的列ID:
发布到xunruicms,如何填写发布目标对应字段
“target网站的字段名”列是对应于xunruicmssystem end的属性
“值源1”列是选择采集字段和一些其他特殊参数(例如爬网URL、爬网时间、随机数等)
注意:可选的采集字段是映射发布目标创建的任务中采集字段的名称
“值源2”列通常用固定值填充
注意:源值1优先。如果为源值1选择了相应的值,则值源2将不会生效
详细说明了以下重要字段:
标题(必填):通常对应于采集字段标题,从“源值1”中选择;(可以选择多个字段)
内容(必填):它是主体部分,通常对应于采集字段内容。您可以从“源值1”中选择它;(可以选择多个组合字段)
列ID(必填):已发布数据的列分类。该值为xunruicmsbackground-->上菜单内容->左菜单列管理-->以查看对应列的ID和模块。不支持多类别发布
始终在“源值2”中填写固定值,或在“值源1”中选择采集字段(有关详细信息,请参阅数据发布-设置分类(列)技能)
进入时间:设置文章发布时间。默认时间为发布时的时间(相当于实时,发布时会显示时间)
经常在“源值1”中选择相应的参数:采集field pubdata、抓取时间、随机时间
也可以使用固定值填写常用时间格式,系统会自动判断转换情况
用户ID:填写xunruicms的现有用户数字ID,值为xunruicmsbackground–>上方菜单中的用户管理–>点击账户弹出详细信息-->获取相应的数字ID
作者:与发布数据的作者姓名相对应,您可以选择值源1中的采集字段(例如作者)或在源值2中填写固定值。如果它不存在,将自动创建它
发布到xunruicms,如何获取用户ID
发布目标第二步中设置的[user ID]对应值为xunruicmsbackground-->上菜单[user]–>左菜单[user management]-->,然后点击账号打开一个小窗口查看用户数字ID
然后在发布目标的步骤2中填写映射字段的用户ID: