自动采集栏目选择——全部勾选:每隔10小时
优采云 发布时间: 2021-04-03 02:07自动采集栏目选择——全部勾选:每隔10小时
自动选择采集列:全部选中
自动采集间隔:每10小时自动采集一次
首次自动采集基本时间:请勿更改
后台文件夹名称:后台登录文件夹的名称,如果您尚未更改,请不要移动它
每次触发采集的次数:99999条
每个规则采集的失败限制:5个项目
功能说明:
首先查看背景函数的呈现:
图中的功能说明:
自动采集开关:在前台访问任何页面时将其打开以触发自动采集功能,否则将其关闭。
它将何时自动发布:
关闭:仅采集,但未发布到前台。
每个触发器:引用采集,并在每次访问前台一次时发布一次。例如,两个人A和B正在访问前台,A打开1页,B打开2页。然后前台被触发了3次。每个触发器为采集一次,三个触发器为采集 3次。但是,如果两个触发器之间的时间间隔太短,例如在5秒钟内,则5秒钟内的多个触发器只能生效一次。它适合忠实的访问者,他们每次打开网站都想要新鲜的内容,而又不介意每次打开网站的速度慢了几秒钟。建议将“每个触发器的数量采集”设置为小于20
每个规则的结尾:这意味着采集规则下的所有文章在发布采集之后才发布,然后完成。适用于采集的规则很多,例如,当规则多于10条时,请避免同时释放大量数据且加载速度太慢的情况。建议将“每个触发器的数量采集”设置在100-1000之间。如果最后一条规则的采集尚未完成,并且达到了“每个触发器采集的数量”,则大于“每个触发器采集的数量”的文章将不会释放。换句话说,规则采集必须先发布,然后才能发布。因此,当您看到在前台释放的文章的数量与在背景采集中释放的文章的数量不同,或者有一些文章尚未释放时,这是正常的。
全部完成采集:表示在所有规则采集完成后发布。它适用于访问者较少或对网站访问速度有较高要求的网站。可以将采集的时间设置为夜晚或清晨,以便用户可以在白天的高峰时段自由浏览网站。建议将“每个触发器的数量采集”设置为1000-10000或更大,因为当您希望采集的文章大于“每个触发器的数量采集”时,不会在采集停止采集之前结束,以便文章不会自动释放,因为在所有采集完成之前无法释放文章。
生成静态开关:当网站处于静态模式时打开此项目,它会在每次自动释放时自动生成与新添加的文章相关的静态主页,列表页面,内容页面。
强制自动生成静态主页开关:您可以强制每次自动发布静态主页时自动生成。此功能不受静态背景模式的影响。可以在一定程度上提高首页的打开速度。当然,前提是在服务器或虚拟主机中将默认主页设置为index.html,以提高访问主页的速度。
采集项目自动选择:只有选中的项目才能自动采集。
自动采集间隔时间:这是一个环形交叉路口,请耐心阅读。指每个完整的采集周期,并且采集仅允许一个周期完成一个周期中的所有项目的机会。当循环中的采集中所有项目都未完成时,这些项目将永远被触发。例如,将自动采集间隔时间设置为1小时,然后所有采集项采集将在30分钟内完成。然后,系统将所有采集完成的时刻设置为“ 采集结束时间|第一个自动采集参考时间|”,下一个采集开始时间为“ 采集结束时间|第一次自动采集基本时间|“ +“自动采集间隔时间”。因此,下一个自动采集将在1小时后。又例如,自动采集间隔时间设置为1小时,然后所有采集项在1小时内未完成,那么系统将继续触发采集,直到所有采集完成。将所有采集结束后的时刻设置为“ 采集结束时间|第一次自动采集参考时间|”,下一个采集开始时间为“ 采集结束时间|第一次自动采集参考时间|”。 ” +“自动采集间隔时间”。这样做的好处是可以根据特定需求多久确定一次采集的频率,并且具有很高的灵活性。
第一个自动采集基本时间:这有点棘手,请耐心阅读。每个后续时间采集都将基于此时间,并且在所有采集完成之后,所有采集完成的时刻将自动为| k。第一个自动的采集基本时间,采集结束时间|将时间重设为此刻。那么采集什么时候开始? 采集的开始时间是“ 采集结束时间|第一次自动采集参考时间|” +“自动采集间隔时间”。例如:第一个自动采集参考时间设置为:2022年8月8日上午是2022-08-08 10:10:20是10:10:20。自动采集的设置间隔时间是1小时,则自动采集的开始时间为2022-08-08 11:10:20,即2022年8月8日上午的11:10:20。然后在下一次所有采集结束后,自动将下一次所有采集结束的时间设置为下一个第一个自动采集参考时间,依此类推。注意:如果没有全部采集的情况下所有采集项的选择都没有完成,则不会自动重置第一个采集自动参考时间。
背景文件夹名称:安装插件后,将自动获得后端文件夹名称,但是在修改默认管理文件夹名称后,您需要手动输入更改的后端文件夹名称,否则插件将不能正常工作。
每次都会触发采集的编号:这意味着采集会在达到该编号时停止。至于是否会自动释放,则与此无关。此设置的目的是控制每个触发器的资源占用,以防止前台用户长时间无法访问该页面。并控制每次更新的数量文章。至于是否发布,则发布的时间与上一篇文章中的“何时自动发布”设置有关。
每个规则采集失败限制:这意味着在每个采集规则采集失败到指定数目之后,它将自动跳过此规则并转到下一个规则采集。通过始终获取大量错误页面来避免浪费服务器资源。当然,采集失败与您的采集规则编写,目标网站的可用性以及目标网站是否为反采集有关。
完成上述所有设置后,前台访问将自动触发采集。
提示:
在初始安装后,如果网站处于静态模式,请为整个站点生成一个静态内容页面。将来,即使更改了插件设置,也无需生成静态信息。
无响应的移动版天人系统不支持前端触发,但在发布后支持文章显示。 (如何识别它是否为非响应移动版本?检查该移动版本的访问路径是否在m文件夹中,如果是,则为非响应移动版本,也就是说,此插件可以不支持其移动版本,但支持其PC版本)
该插件正常运行的前提是前台有访问者,因此,每次采集的具体时间取决于前台访问者的访问时间。例如,如果您的网站访问者很小,则每天只有几个UV。然后,将“每个触发器的数量采集”设置得更大一些。触发之后,访问者会及时关闭页面,并且不会影响插件继续采集,发布和生成静态页面。换句话说,在访问者访问之后,它仅被触发,其余的由服务器执行。因此,该插件的此功能可用于仅通过访问前台中的任何页面即可快速实现采集 文章的效果。
常见问题:
问:此自动采集插件是否收录采集规则?在哪里写采集规则?
A:此自动采集插件自动调用网站后台-采集管理规则管理中的规则。换句话说,只要您的网站后台中现有的采集规则适用于此插件,就无需重写采集规则。要专门选择哪些规则是自动采集,请转到“ 网站背景-我的插件-查找”“自动采集插件”行,然后单击“功能1”按钮进入管理” 。 采集规则在您的网站背景-采集管理-规则管理中进行编译。 采集有关编写规则的教程,请参见
问:网站没有人拜访,也没有人拜访,这会自动发生吗采集?
A:如果您的网站已经访问了很多天,没有人去过,包括您在内的任何人都没有访问前台,那么它将不会自动出现采集。但是,如果任何人浏览页面的页面,它将立即触发采集,即使他在触发之后立即关闭页面,也不会影响自动采集的继续执行。因此,如果您的网站访问者人数特别少,建议将自动采集的时间间隔设置为几分钟或几十分钟。同时,将每个触发器采集的数量设置为更大的数量,例如100个或更多。
问:如何判断某个规则是否可以为采集?
A:该插件与后端随附的采集函数具有相同的支持范围,也就是说,只要这是后端中采集的规则即可- k15]管理,也可以在此插件采集中使用。如果您无法采集,建议从以下几个方面入手:1、之前可以采集,但是有一天突然没有采集目标网站修订版,目标电台网站停机时间,目标电台已采取预防措施采集设置。 2、无法执行采集,您的规则有问题(请检查规则,N年后,无数人确认该程序的采集功能没有问题,因此请不要怀疑程序的采集功能存在问题,我们对此也非常不耐烦。其中99%的此类疑问发生在刚学习采集不到1个月的新手中) ,目标网站修订版,目标站点网站停机时间,目标站点已进行反采集设置。因此,如果您可以排除采集规则问题,如果仍然无法解决采集,则更改为另一个目标网站。许多方面都会影响采集的成功。
更新日志: