云优cms文章采集(一下.2.8小说采集教程-导入采集规则--一下 )
优采云 发布时间: 2021-11-17 04:13云优cms文章采集(一下.2.8小说采集教程-导入采集规则--一下
)
采集教程:
D'V" o! y9 W9 y/ _2 L
安装ptcms4.2.8小说程序后,很多朋友不知道如何配置采集教程。今天就来介绍一下具体的采集方法。
导入采集 规则,选择一个新站点,并添加一个新书勾。其他默认(以后如果源站点更改规则无效,可以找人写下无效站点的规则,然后导入,选择这个旧站点,覆盖相应的站点和规则)
单击测试,先测试规则是否可以使用,然后添加后台任务计划。采集 默认的时间间隔是600,我觉得时间太长了,所以设置为60。
然后只需启动并运行即可。我这里开了 如果提示主线进程状态失败,时间也是1970,采集不行,说明你没有配置cron。
现在可以自动采集,但是由于ptcms的特性,每天自动采集会几百个。有的人网站刚建好,小说太少了。太慢了,希望我能主动采集多少份,然后自动挂断采集,现在解释一下
一般选择后台离线采集,选择规则,自定义页面,页面填写为采集,例如
这个页面是第一页,第二页只有后面的1变成了2。你可以用这个页面代码代替例如
比如我想要这个页面的第1-5页采集,我可以像下图这样写。这就是教程。我没有在里面使用书号采集。书号采集 很容易出现采集 来废弃小说或许多未发现的小说。