解决方案:自动采集插件
优采云 发布时间: 2021-01-01 11:16解决方案:自动采集插件
自动选择采集列:全部选中
自动采集间隔:每10小时自动采集一次
首次自动采集基本时间:请勿更改
后台文件夹名称:后台登录文件夹的名称,如果您尚未更改,请不要移动它
每次触发的采集数量:5条
每个规则采集的失败限制:5个项目
功能说明:
首先查看背景函数的呈现:
图中的功能说明:
自动采集开关:将其打开以使前台访问任何页面时触发自动采集功能,否则将其关闭。
它将何时自动发布:
关闭:仅采集,但未发布到前台。
每个触发器:引用采集,并在每次访问前景一次时发布一次。例如,两个人A和B正在访问前台,A打开1页,B打开2页。然后前台被触发了3次。每个触发器为采集一次,三个触发器为采集 3次。但是,如果两个触发器之间的时间间隔太短,例如在5秒钟内,则5秒钟内的多个触发器只能生效一次。它适合每次打开网站都想要新鲜内容且不介意打开网站几秒钟的忠实访客的用户。建议将“每个触发器的数量采集”设置为小于20
每个规则的结尾:这意味着采集规则下的所有文章在发布采集之后才发布,然后完成。适用于采集的规则数量很多,例如,当规则数量超过10个时,请避免同时释放大量数据且加载速度太慢的情况。建议将“每个触发器的数量采集”设置为100-1000。如果最后一条规则的采集尚未完成,并且达到了“每个触发器采集的数量”,则大于“每个触发器采集的数量”的文章将不会释放。换句话说,规则采集必须结束后才能发布。因此,当您看到在前台文章释放的数量与在背景采集中释放的文章数量不同,或者有一些文章尚未释放时,这是正常现象。
全部完成采集:表示在完成所有规则采集之后发布。它适用于访问者较少或对网站访问速度有较高要求的网站。可以将采集的时间设置为夜晚或清晨,以便用户在白天的高峰时段可以自由浏览网站。建议将“每个触发器的数量采集”设置为1000-10000或更大,因为当您希望采集的文章大于“每个触发器的数量采集”时,不会在采集停止采集之前结束,因此文章不会自动释放,因为在所有采集完成之前无法释放文章。
生成静态开关:当网站处于静态模式时打开此项目,它会在每次自动释放时自动生成与新添加的文章相关的静态主页,列表页面,内容页面。
强制自动生成静态主页开关:您可以强制每次自动发布时自动生成静态主页。此功能不受静态背景模式的影响。可以在一定程度上提高首页的打开速度。当然,前提是在服务器或虚拟主机中将默认主页设置为index.html,以提高访问主页的速度。
采集项目自动选择:只有选中的项目才能自动采集。
自动采集间隔时间:这是一个环形交叉路口,请耐心阅读。指的是每个采集完整周期,并且采集仅一个机会完成一个周期中的所有项目。当循环中的采集中所有项目都未完成时,这些项目将永远被触发。例如,将自动采集间隔时间设置为1小时,然后在30分钟内完成所有采集项采集。然后,系统将所有采集完成的时刻设置为“ 采集结束时间|第一次自动采集参考时间|”,下一个采集开始时间为“ 采集结束时间|第一次”自动采集基本时间|“ +“自动采集间隔时间”。因此,下一个自动采集将在1小时后。另一个示例是将自动采集间隔时间设置为1小时,然后所有采集项目在1小时内未完成,然后系统将继续触发采集,直到所有采集完成。将所有采集结束后的时刻设为“ 采集结束时间|第一次自动采集参考时间|”,下一个采集开始时间为“ 采集结束时间|第一次自动采集参考时间|“ +“自动采集间隔时间”。这样做的好处是可以根据特定需求采集确定频率,这非常灵活。
第一个自动采集基本时间:这有点偶然,请耐心阅读。每个后续的采集都将基于此时间,并且每次所有采集完成后,所有采集完成的时刻将自动为|。首先自动的采集基本时间,采集结束时间|将时间重设为此刻。那么采集什么时候开始? 采集的开始时间是“ 采集结束时间|第一次自动采集参考时间|” +“自动采集间隔时间”。例如:第一个自动采集的参考时间设置为:2022年8月8日上午的2022-08-08 10:10:20是10:10:20。自动设置的采集间隔是1小时,则自动采集的开始时间为2022-08-08 11:10:20,即2022年8月8日的11:10:20。然后在下一次所有采集结束后,下一次,所有采集结束时间都将自动设置为下一个第一个自动采集参考时间,依此类推。注意:如果所有采集项目都未全部完成采集,则不会自动重置第一个自动采集参考时间。
背景文件夹名称:安装插件后,它将自动获取后端文件夹名称,但是在修改默认管理文件夹名称之后,您需要手动输入更改的后端文件夹名称,否则插件将无法正常工作。
每次触发采集的数量:这意味着采集达到该数量时将停止。至于是否会自动释放,则与此无关。此设置的目的是控制每个触发器的资源占用,以防止前台用户长时间无法访问该页面。并控制每次更新的数量文章。至于是否发布,则发布的时间与上一篇文章中的“何时自动发布”设置有关。
每个规则采集失败限制:这意味着每个采集规则采集将在指定的失败次数后自动跳过该规则,并转到下一个规则采集。通过始终获取大量错误页面来避免浪费服务器资源。当然,采集失败与您的采集规则编写,目标网站的可用性以及目标网站是否为反采集有关。
完成上述所有设置后,前台访问将自动触发采集。
提示:
在初始安装后,如果网站处于静态模式,请为整个站点生成一个静态内容页面。将来,即使更改了插件设置,也无需生成静态信息。
天人系统的无响应移动版本不支持前端触发,但在发布后支持文章显示。 (如何识别它是否为非响应移动版本?检查该移动版本的访问路径是否在m文件夹中,如果是,则为非响应移动版本,也就是说,此插件可以不支持其移动版本,但支持其PC版本)
插件正常运行的前提是前台有访问者,因此每次的特定采集时间取决于前台访问者的访问时间。例如,如果您的网站访问者很少,则每天只有几个UV。然后,将“每个触发器的编号采集”设置得更大一些。触发之后,访问者会及时关闭页面,并且不会影响插件继续采集,发布和生成静态页面。换句话说,在访问者访问之后,它仅被触发,其余的由服务器执行。因此,您可以使用插件的此功能,只需访问前台中的任何页面即可快速达到采集 文章的效果。
常见问题:
问:此自动采集插件是否收录采集规则?在哪里写采集规则?
A:此自动采集插件将自动调用网站后台-采集管理规则管理中的规则。换句话说,只要您的网站后台中的采集规则适用于此插件,就无需重写采集规则。要专门选择哪些规则是自动采集,请转到“ 网站背景-我的插件-找到“自动采集插件””行,然后单击“功能1”按钮进入管理” 。 采集规则在网站背景-采集管理-规则管理中进行编译。 采集有关编写规则的教程,请参见
问:网站没有人拜访,也没有人拜访,这会自动发生吗采集?
A:如果您的网站已经很多天没有被访问了,包括您在内的任何人都没有访问过前台,那么它将不会自动出现采集。但是,如果某个人正在浏览页面,它将立即触发采集,即使他在触发后立即关闭页面也不会影响自动采集的继续执行。因此,如果您的网站访问者人数特别少,建议将自动采集的时间间隔设置为几分钟或几十分钟。同时,将每个触发器采集的数量设置为更大的数量,例如100个或更多。
问:如何判断某个规则是否可以为采集?
A:该插件与后端附带的采集功能具有相同的支持范围,也就是说,只要在后端-采集管理,也可以在此插件中为采集。如果您不能采集,建议从以下几个方面入手:1、以前可以采集,但是有一天突然没有采集目标网站修订版,目标台网站是向下,则阻止目标站采集设置。2、不能一直采集,您的规则存在问题(请亲自检查规则,N年后,无数人确认我们,采集函数没有问题程序,所以请不要质疑采集函数存在问题,我们对此也非常不耐烦。其中99%的此类疑问发生在刚学习采集不到1个月的新手中) ,目标网站修订版,目标站点网站停机时间,目标站点已进行反采集设置。因此,如果您可以排除采集规则问题,如果仍然无法解决采集,则更改为另一个目标网站。许多方面都会影响采集的成功。
更新日志: