免规则采集器列表算法(就是数据库连接信息填写错误网站目录目录设置不正确 )
优采云 发布时间: 2022-02-25 16:17免规则采集器列表算法(就是数据库连接信息填写错误网站目录目录设置不正确
)
有时候这种情况经常会出现,也就是做模板或者买源码,看似没有问题,但是当采集出现各种错误,比如“关闭海关采集器@” “加载新奇信息时出错”等问题,有时几天搞不定。怎么说呢,其实关关采集器@>是一个比较虚伪的程序。很多地方的问题都会导致采集异常。有时我觉得普通的采集是一种幸运。但总之有一个关键点就是Jackie的原程序,采集一般是正常的。
首先,让我列出我知道的无法采集的原因:
1.数据库连接信息填写错误
2.网站目录设置不正确
3.Jacky 版本设置不正确
4.文件夹没有读写权限
5.数据库异常或无写权限
6.目录页和阅读页模板调用语句不识别
7.服务器环境缺少支持组件
8.jacky分页标签因为第二次修改无法识别
9.小说模块的参数配置文件出错
10.采集规则或采集源站有问题
11.性格不好
通过以上问题可以发现,这11项中,有5项是程序本身的问题,而这5项也是最常出现的问题。为什么?
有几个原因:
1.因为程序复制粘贴、上传等,可能会破坏文件夹权限,或者损坏文件。
2.模板开发写更复杂的目录或者读调用语句,追求更美的效果。
3.为了网站的整体美观,修改Jackie默认分页标签对应的代码。
4.个性,凡人行为
但总的来说,修复这些问题是极其困难的,但由于模板制作要求,直接放弃采集是不可能的。其实有一个很好的解决方案,就是使用Jackie的一个库多站点,这个方法可以为网站的封面图,或者用户头像,和网站@分配一个单独的域名> 整体方案基本不变。
嗯,教程是这样的
1.这种配置的概念很明显。在这个过程中,需要一个不可访问的站点为采集,用于保存图片和txt。而其他一个或多个站点只负责渲染和检索数据,所以case的设置如下:
采集: F:/web/sitecj
渲染:F:/web/sitecx
2.设置域名绑定,采集站不需要绑定到根目录,而是绑定到files文件夹,这样网站根本无法访问,而且渲染只需要绑定到根目录就可以了,毕竟只是用来访问的:
采集:127.0.0.1 绑定到:F:/web/sitecj/files
渲染:127.0.0.2 绑定到:F:/web/sitecx
3.设置渲染站的配置,调用图片和txt文件:
设置系统管理-参数设置-成员头像保存目录:F:/web/sitecj/files/system/avatar
设置系统管理-参数设置-会员头像访问网址:
设置小说序列化模块-参数设置-文本存储目录:F:/web/sitecj/files/article/txt
设置小说序列化模块-参数设置-OPF文件目录:F:/web/sitecj/files/article/txt
设置小说序列化模块-参数设置-封面图片保存目录:F:/web/sitecj/files/article/image
设置新颖的序列化模块-参数设置-访问封面图片的URL:
注意如果需要开启txt下载等功能,还需要在后台配置自己所在的目录
4.[重要] 采集 和渲染的 网站 都使用相同的数据库。如果有权限问题阻止渲染站读取采集站的txt目录,可以是采集站点,设置为渲染站点的子目录,作为子网站,以免因权限问题而无法读取。当然,限制跨站目录读取的设置也可以解除。
最后,采集器@> 的设置
设置网站目录:F:/web/sitecj //其实就是采集站的文件目录
设置数据库:两个 网站 共享的数据库连接
设置成龙版:按照目前的情况,总之两个网站最好的成龙版是一样的,其实采集站是原版成龙官方程序,渲染站不能用于采集Jackie的主要二次开发版本。对于版本 2.2 和 2.3,可以使用 1.8 作为 采集 站。
以上是利用捷奇易酷的多站配置,解决自己制作或购买的程序和模板不能采集的问题。其实很多时候,修改Jackie的默认目录、读取、分页文件都是免不了的。毕竟网站的套路越来越复杂,单纯的模式已经不能满足要求了。不过有些版本的采集器@>好像没有这样的问题,所以以实际为准,而本教程也可以将采集和呈现的网站完全分开,甚至扔掉完全不同的磁盘(当然这似乎不安全)
教程已添加熊掌号原创保护,转载并注明出处。
喜欢 0
报酬
千水万山,永远相爱,打赏也无妨。报酬