文章定时自动采集(商业版采集插件的经验分享,教你如何设置定时自动采集发布功能)
优采云 发布时间: 2021-09-08 15:25文章定时自动采集(商业版采集插件的经验分享,教你如何设置定时自动采集发布功能)
我一定用过 Discuz!建站的站长都用过采集插件,那批采集插件呢?这个插件真的为Discuz的站长们撑起了半边天。你为什么这么说?如果你使用这个插件在后台进行操作,即使你不用花钱在Discuz的应用中心购买商业版,你也可以用这个插件在半小时内发布数百个文章每天。当然如果你是商业版你也可以设置定时自动采集发布功能,只要你的采集目标网站有足够的内容就可以设置相关参数,不用去后台每天手动操作。这不是很麻烦吗? 闲话不多说,开始今天的经验分享。
首先我们到后台选择“应用”“DXC采集”和“设置”,如下图:
DXC采集plugin
进入设置
第二步,添加采集器,如图:
添加采集器
第三步,这是最重要的一步,仔细看!
找到目标网站的文章列表页的最后一页。注意:这里的列表页面的页面地址必须是正规的!如图:
目标列表页的最后一页
在采集器中填写列表页面,设置你想要采集哪些列表页面的文章和采集页面增长率,然后测试列表页面采集是否设置成功; 文章的获取规则设置为“智能获取”。如果需要限制采集内容的范围,在下框中写下需要限制的列名的相对地址,然后保存,如图:
设置列表页采集rule
选择“内容规则”选项卡,进入页面内容采集设置步骤。首先点击右侧的“点击自动获取”,然后会在左侧的页面地址框中获取您之前设置的列表页面中文章之一的地址,点击访问进入页面并获取页面采集元素,如图:
获取文章page
进入内容页面后,右键查看源码,复制标题代码,粘贴到title采集rule框中,然后如图设置,如图:
获取标题代码
设置页面内容获取规则,选择“通过DOM获取”,然后进入文章页面,找到文章content区块对应的区块标识码,如图5-1和图5 -2:
获取文章block的识别码:
在规则框中填写识别码,记得用“div#(内容块识别码)”,然后选择“检查标题是否重复:”如图
设置内容获取码
至此,页面列表采集和内容获取已经设置完毕。下一步非常简单。设置发布规则,如图。至于需要发布什么账号,只需要在发布设置下设置“自定义uid”即可。在框内输入*敏*感*词*号即可(提示:uid1是网站的创始人)。如图:
发布规则设置
第三步,在其他设置选项中设置采集暂停时间。这里推荐5,15的频率,不容易造成识别超时,然后保存启动采集,如图:
其他设置
终于到了激动人心的时刻,放手发帖采集。至此,这段经历就结束了。如果您还是不知道怎么办,请留言,我会及时为您提供支持,谢谢