无规则采集器列表算法(宝塔面板+Python+94采集器5.2.4采集规则和以前版本的规则)
优采云 发布时间: 2022-04-10 17:21无规则采集器列表算法(宝塔面板+Python+94采集器5.2.4采集规则和以前版本的规则)
94采集器5.2.4 采集规则和之前版本的规则差不多,但是老版本的规则不能用在94caiji 5.@ >2.@ >4版本用的,至于写法和设定,差别不大。这里我们详细写一下。
注意:例如规则或工作规则,您可以在页面底部查看。
规则环境
宝塔面板+Python+94采集器5.2.4
添加规则
导入最新可以使用的规则,将规则代码粘贴进去
图1 94采集器导入规则
图2 94采集器粘贴代码
图3 94采集器陈工导入规则
测试规则
将采集链接粘贴进去,测试规则是否正常,按照下图顺序
图 4 94采集器默认采集URL
图5 94采集器规则测试
图6 94采集器规则测试
图7 94采集器采集规则测试
添加的任务
任务采集中有很多重要的设置。设置时要考虑你的服务器性能和网站本身的需求。这里我就详细写一下,接下来大家主要看图片设置。因为我是用VPS测试的,所以有些参数设置比较小,仅供参考。
任务ID:空白,数据会在后面自动填写
规则 ID:选择 采集 规则
任务名称:随便写
间隔时间:这里的单位是秒。如果数据太小会导致采集源站被阻塞,一般600-1800秒
添加类型:有四个选项,一般默认选择“添加” Normal采集
Default, ISBN, ISBN List, List:这个选项是根据你的规则选择和配置的,这里我们的规则是基于列表采集的,所以我们只配置图片中的列表,大家可以自己参考具体设置规则配置。
封面更新:否
*敏*感*词*更新:否
标志修复:是的
修复字数:1000
采集间隔:0.1-10
重试次数:5-60
重试间隔:1-30
最少章数:2 不少于2章采集
最大章节数:10000 章节超过 10000 的章节不是 采集
UserAgent:直接选择,因为在配置系统参数的时候已经添加
比较方法:根据需要选择最后一个章节名称
小说线程数/章节线程数:根据服务器配置写,我是1H1G的测试vps,所以写1-2
代理信息设置:如果使用代理,请在此处设置
过滤信息设置:如果有不想采集的小说名,写在这里
采集规则
需要的可以下载以下规则,采集源码站piaotian5 com,劳动产品,谢谢支持
内容查看此隐藏内容查看价格为 10 德文,请先登录