文章定时自动采集(用户反馈自动生成和自动采集不给力的运行原理是什么?)
优采云 发布时间: 2021-08-29 20:06文章定时自动采集(用户反馈自动生成和自动采集不给力的运行原理是什么?)
这几天有用户反馈自动生成和自动采集不是很有效,发现用户每天的访问量很低,甚至很少有人访问。在这种情况下,自动生成或者自动采集效果就很不理想了。是的,这是它的工作原理。
该函数需要依赖前端访问才能触发执行,但是如果用户在前端访问网站,则会触发页面特殊判断自动生成采集JS脚本,并且满足条件时执行。
执行优先级:首页静态页面“列表页面静态页面”内容页面静态页面“采集,系统会先判断首页静态页面,满足条件就会生成首页静态页面,并且下面的内容不会被执行;如果不符合要求,检查列表页面的静态页面,等等。如果列表页面的静态页面的后台设置为关闭,则会不加判断直接跳过。
再次设置间隔。根据文章的更新频率,首页静态页推荐30分钟到几个小时,列表页推荐15到30分钟,内容页推荐5到20分钟,采集自己看就行了想一天自动更新几篇文章,可以设置3~5小时。如果想及时获得目标网站新文章,可以设置2~5分钟。实际效果取决于网站的情况。如果你的网站访问量很大,设置的间隔太短,前台的访客可能会明显感觉到网站很慢,会卡死。在这种情况下,请设置一个大的间隔。
特别注意。如果开启了自动采集,在采集项目中不要勾选【逆序采集】,否则会从尾部检测而不是头部检测。很容易发现采集文章,当检测到采集的次数超过设置的【每次最大失败次数】时,采集会直接被停止,导致部分用户保持采集小于文章 自动。还有一个时间间隔设置。用户内容页面间隔为1分钟,采集间隔也是1分钟。如果网站一分钟被不少于2人访问,那没关系。如果小于一分钟,则生成内容页面一分钟。然后,内容页就生成了,还没轮到执行采集,所以时间间隔的设置也很重要。
最后,如果网站的流量很小,并且想要有一定的自动更新频率,并且使用的是VPS服务器,可以推荐下载【NetTi定时运行网页】这个工具,并且点击【新建任务】填写名称和要求 打开网站,选择【每天】-【时间间隔】,填写时间。这取决于您要使用的频率。如果采集设置为5分钟,这里可以设置2分钟。
附件下载
NetTi 定期运行网页