无规则采集器列表算法(宝塔面板+Python+94采集器5.2.4采集规则和以前版本的规则)

优采云 发布时间: 2022-04-10 17:21

  无规则采集器列表算法(宝塔面板+Python+94采集器5.2.4采集规则和以前版本的规则)

  94采集器5.2.4 采集规则和之前版本的规则差不多,但是老版本的规则不能用在94caiji 5.@ >2.@ >4版本用的,至于写法和设定,差别不大。这里我们详细写一下。

  注意:例如规则或工作规则,您可以在页面底部查看。

  规则环境

  宝塔面板+Python+94采集器5.2.4

  添加规则

  导入最新可以使用的规则,将规则代码粘贴进去

  

  图1 94采集器导入规则

  

  图2 94采集器粘贴代码

  

  图3 94采集器陈工导入规则

  测试规则

  将采集链接粘贴进去,测试规则是否正常,按照下图顺序

  

  图 4 94采集器默认采集URL

  

  图5 94采集器规则测试

  

  图6 94采集器规则测试

  

  图7 94采集器采集规则测试

  添加的任务

  任务采集中有很多重要的设置。设置时要考虑你的服务器性能和网站本身的需求。这里我就详细写一下,接下来大家主要看图片设置。因为我是用VPS测试的,所以有些参数设置比较小,仅供参考。

  

  任务ID:空白,数据会在后面自动填写

  规则 ID:选择 采集 规则

  任务名称:随便写

  间隔时间:这里的单位是秒。如果数据太小会导致采集源站被阻塞,一般600-1800秒

  添加类型:有四个选项,一般默认选择“添加” Normal采集

  Default, ISBN, ISBN List, List:这个选项是根据你的规则选择和配置的,这里我们的规则是基于列表采集的,所以我们只配置图片中的列表,大家可以自己参考具体设置规则配置。

  封面更新:否

  *敏*感*词*更新:否

  标志修复:是的

  修复字数:1000

  采集间隔:0.1-10

  重试次数:5-60

  重试间隔:1-30

  最少章数:2 不少于2章采集

  最大章节数:10000 章节超过 10000 的章节不是 采集

  UserAgent:直接选择,因为在配置系统参数的时候已经添加

  比较方法:根据需要选择最后一个章节名称

  小说线程数/章节线程数:根据服务器配置写,我是1H1G的测试vps,所以写1-2

  代理信息设置:如果使用代理,请在此处设置

  过滤信息设置:如果有不想采集的小说名,写在这里

  

  采集规则

  需要的可以下载以下规则,采集源码站piaotian5 com,劳动产品,谢谢支持

  内容查看此隐藏内容查看价格为 10 德文,请先登录

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线