自动采集栏目选择:全部勾选自动发布篇
优采云 发布时间: 2021-08-25 18:03自动采集栏目选择:全部勾选自动发布篇
自动采集列选择:勾选所有
自动采集间隔:每10小时自动采集一次
第一次自动采集base time:不要改这个
Backstage文件夹名称:后台登录文件夹的名称,没改过就不要动了
每次触发采集的数量:99999篇
每条规则采集Failure 限制:5
功能说明:
先看后台函数的渲染:
图中功能说明:
自动采集开关:开启后前台可以访问任意页面触发自动采集功能,否则关闭。
什么时候会自动发布:
关闭:只有采集,但没有发到前台。
每次触发:表示前台每访问一次,就会采集,发布一次。比如A和B两个人在访问前台,A打开1页,B打开2页。然后前台被触发了3次。每个触发器会采集一次,3个触发器会采集3次。但是,当两次触发的时间间隔太近时,例如5秒以内,5秒内的多次触发只能生效一次。适合每次打开网站都想要新鲜内容,不介意每次打开网站慢几秒的忠实访问者。建议将“每次触发采集quantity”设置在20以内
每条规则结束:表示这条采集规则下的所有文章都采集完成后将被释放。 采集规则数量较多,比如规则超过10条时,避免大量数据一起发布,加载太慢的情况。建议将“每次触发采集quantity”设置在100-1000之间。如果最后一条规则的采集还没有完成,并且达到了“采集quantity per trigger”,那么大于“采集quantity per trigger”的文章将不会被发布。换句话说,规则采集必须结束才能发布。所以,当你看到前台发的文章的数量和后台采集发的文章的数量不一样,或者有的文章没有发,这是正常的。
All 采集completed:表示所有规则在发布前全部采集完成。适用于访问者较少或对网站访问速度要求较高的网站。您可以将采集的时间设置为晚上或清晨,方便用户在白天高峰时段自由浏览网站。建议将“每个触发器采集quantity”设置在1000-10000或更大的范围内,因为当你希望采集的文章大于“每个触发器采集quantity”时,不是结束采集采集,这样文章就不会自动释放了,因为文章直到采集全部完成后才能释放。
生成静态开关:网站处于静态模式时启用此选项,每次自动发布时都可以自动生成与新添加的文章相关的静态首页、列表页、内容页。
强制自动生成静态主页开关:可以在每次自动发布时强制自动生成静态主页。该功能不受后台静态模式的影响。一定程度上可以提高首页的打开速度。当然前提是在你的服务器或者虚拟主机中设置默认主页为index.html,以提高访问主页的速度。
自动采集项目选择:只有选中的项目才能自动采集。
Auto 采集interval period:这有点偶然,请耐心阅读。指每一个完整的采集周期,一个周期内只允许一次采集完成所有项目的机会。当循环中没有采集已完成的项目时,该项目将继续被触发。比如自动采集间隔设置为1小时,然后所有采集项目在30分钟内完成采集。那么采集全部完成的时刻会被系统设置为“采集End Time|First Auto采集reference time|”,下一个采集开始时间为“采集完成时间” |起始自动采集参考时间|" +“自动采集间隔期”。所以下一次自动采集 将在 1 小时后。再比如自动采集间隔周期设置为1小时,然后在1小时内没有完成所有采集项目,那么系统会一直触发采集直到所有采集完成。设置所有采集结束后的时刻为“采集end time|第一次自动采集reference time|”,下次采集start时间为“采集end time|第一次自动采集标准时间|" +“自动采集间隔期”。这样做的好处是采集的频率可以根据具体需要确定,非常灵活。
第一次自动采集reference time:这有点棘手,请耐心阅读。以后每次采集都会以这个时间为基准,每次采集全部完成,采集全部完成的时刻,自动是第一次采集参考时间,采集完成时间将时间重置到这一刻。那么采集 什么时候开始呢? 采集开始的时间为“采集end time|第一次自动采集reference time|” + "auto采集interval 周期"。例如:第一次自动采集参考时间设置为:2022-08-08 10:10:20 为2022年8月8日上午10:10:20。自动采集设置间隔为1小时,那么自动采集的开始时间是2022-08-08 11:10:20,也就是2022年8月8日的11:10:20。 那毕竟下次采集结束,现在的时间下次所有采集结束时自动设置为下一次自动采集参考时间,以此类推。注意:如果不是所有采集和所有选中的采集项目,第一次自动采集参考时间不会被重置。
后台文件夹名称:插件安装后会自动获取后台文件夹名称,但修改默认admin文件夹名称后,需要手动输入修改后的后台文件夹名称,否则插件会无法正常工作。
每次触发采集quantity:表示达到数量时采集将停止。至于是否会自动发布,与此无关。这个设置的目的是控制每次触发时的资源占用,防止前台用户长时间无法访问页面。并控制文章每次更新的次数。至于是否会发布,何时发布与上一篇文章中“何时会自动发布”的设置有关。
每条规则采集failure 限制:表示每条采集rule 采集未能达到指定数量后,将自动跳过该规则,使用采集下一条规则。避免通过一直获取大量错误页面来浪费服务器资源。当然采集failure跟你的采集规则写法,目标网站的可用性,目标网站是否阻止采集有关系。
以上所有设置完成后,前台访问会自动触发采集。
提示:
初始安装后,如果网站处于静态模式,请为整个站点生成一个静态内容页面。以后即使插件设置改了也不需要生成statics。
天人系统无响应手机版不支持前端触发,发布后支持文章显示。 (如何识别是否是无响应手机版?查看手机版的访问路径是否在m文件夹下,如果是则是无响应手机版,即这个插件没有不支持手机版,但支持PC版)
插件正常运行的前提是前台有访客,所以每次具体的采集时间取决于前台访客的访问时间。例如,如果您的网站 访问者较少,则每天只有几个 UV。然后请将“每个触发器采集quantity”设置得更大。触发后,访问者及时关闭页面,不影响插件继续采集,发布,生成静态。也就是说,访问者访问后,只触发,其余由服务器执行。所以可以利用插件的这个功能,达到只访问前台任意页面快速采集文章的效果。
常见问题:
问:这个自动采集插件是否收录采集规则?在哪里写采集规则?
A:这个自动采集插件是自动调用网站Background--采集管理--规则管理中的规则。换句话说,您不需要重写采集 规则,只要您的网站background 现有采集 规则会适应此插件。具体选择哪些规则是automatic采集,请到“网站Background--My Plugin--找到“Auto采集plugin”这一行,点击“Function 1”按钮进入管理” . 采集rules 写在你的网站background--采集管理--规则管理中。 采集rule 编译教程,请看
问:网站无人访问,无人访问,这种情况会自动采集吗?
A:如果你的网站被访问了很多天,没有人访问过,没有人包括你,没有访问过前台,那么它不会自动采集。但是,如果任何人浏览一个页面会立即触发采集,即使他在触发后立即关闭页面,也不影响采集的自动执行。所以,如果你的网站访问者特别少,建议将采集的自动间隔设置为几分钟或几十分钟。同时,将每个触发器采集的数量设置为更大的数字,例如100个或更多。
Q:如何判断某条规则是否可以采集?
A:这个插件的支持范围和后端自带的采集一样,也就是说只要是后端——采集管理中能采集规则,在这个插件中也可以是采集。如果不能采集,建议从以下几个方面入手:1、前能采集,有一天突然不能采集target网站改版,目标站网站邓机,目标站做了防御采集Settings。 2、一直无法采集,你的规则有问题(请自行检查规则,N年之后无数人确认程序的采集功能没有问题,所以请做不要质疑程序的采集功能有问题,我们也很不耐烦,这种质疑99%发生在刚学采集不到1个月的新手), target网站改版,target station网站邓机,target 该站做了反采集设置。所以如果你可以排除你的采集规则问题,但你仍然不能采集,那就换一个目标网站。很多方面都会影响采集的成功。
更新日志: