技术文章:杰奇CMS小说关关采集器配置教程(文字+视频) 免费下载
优采云 发布时间: 2020-09-07 02:40节气cms Novel Guan Guan 采集器配置教程(文字+视频)免费下载
[Jie Qi cms Novel Guan Guan 采集器 Configuration Tutorial Video]我不知道何时获得它。我看到该视频可能是V9版本,但是您可以参考当前流行的主要版本。由于许多设置技术是相同的,因此我们在这里共享它们。顺便说一句,我还发布了我采集的教程的文本版本,以供您参考。
目录介绍
规则文件夹,日志文件夹:
规则是我们推迟采集条规则的地方;
log是一个日志文件,也就是说,当采集器出错时,它将记录错误的信息。当我们看到这一点时,我们知道采集在哪里错误;
现在,我们单击开关以关闭采集器,直接打开NovelSpider.exe,然后可以启动开关采集器。 (注意:打开过程会有点慢,因此请单击一次并稍等片刻。请勿单击再次打开,否则一段时间采集器后将打开多个级别!)
在某些级别上会有一个提示框,因此我们不在乎。
系统设置
打开后,我们应立即修改“设置(S)”→系统设置。 :
1.修改本地网站目录,例如,我的目录位于D:\ xiaoshuo
2.再次修改数据库连接字符串
DataSource = 12 7. 0. 0. 1;
Database =数据库名称;
UserID =数据库管理用户名;
Password =数据库管理密码;
port = 3306;
charset = gbk
上面的设置是为了关闭采集器,这是您第一次使用它,您需要对其进行设置,而无需在设置后再次进行设置。
分类设置
首先:类别设置通常对应于类别,这些对应于您的网站类别。例如
1 | Fantasy Fantasy =,幻想,幻想,魔术,魔术,幻想魔术,幻想幻想,幻想小说,幻想·魔术,幻想世界,幻想幻想,
1是您的网站第一个蓝色稻米幻想幻想。等号是采集目标网站可能遇到的分类之后,越详细越好,某些模板网站对应于您的幻想幻想。如果您没有幻想模板,只需添加它即可。
第二个:是设置中的一代
默认情况下无需修改。第一个生成的内容页面html是您的网站小说目录页面的html。如果您网站使用伪静态,则不需要生成它。生成的第二个内容页面html是单击小说的内容以查看小说的文本章节。这与上面的第一个相同。如果您网站使用伪静态,则不需要生成它。
如果要构建静态小说网站,则需要生成它,这非常消耗硬盘。通常,一千本小说需要几GB的空间。
第三:生成全文阅读。不用担心,通常不使用。
第四:生成OPF。必须生成此文件,否则无法打开网站,并且如果未生成您的小说网站,也会出现打开错误。只需在此处打勾。不用担心其他设置,没有特殊要求您将无法使用它们。 (注意:[Settings-e-book settings]不需要控制,默认值就足够了,因此不要选择对勾,设置中的图片设置也是默认值,因此不要选择对勾。)
第五:文字广告。如果要在新颖内容中添加广告,则可以在此处添加内容。您需要选择第一个存储章节以添加文字广告。实际的存储空间会将您的广告添加到您采集下的小说中,这些路径的txt文件中的文件/ article / txt / 0/1
这是您的小说,是一部移动版本,因此您需要选择第一本。添加广告时,您会在章节阅读中看到它,但不要使用这些功能。
第六:其他[过滤和替换],[文本到图片]。无需控制
第七:日志选择。勾选所有人。这是采集遇到的错误的日志。您可以基于此消除错误。
规则测试
单击规则进入规则管理器,我们选择我们不能做的三角形符号,下拉并选择要测试的规则,单击右侧的加载,然后单击“测试规则”,如果出现“是要获取ID和小说名称”,则会弹出一个界面
这是为了获得包括小说名称分类介绍和封面在内的小说信息内容。
某些网站信息不完整采集。如果我们采集回来,它将显得不完整。这没有作用。您可以阅读小说的主要章节。然后是获得采集的章节,这是获得小说的内容。
这是一个很好的采集规则。我们可以使用采集规则更新采集小说。
如何采集
通常,我们使用标准的采集模式。
当我们单击“ 采集 –标准采集模式”时,有时会出现错误消息。无论我们单击采集框架中的规则,它都会出现在正确的位置,并且还会出现一些其他提示。忽略他,只需单击[继续]。
输入标准采集后输入正确的姿势后,通常使用第一个根据目标测站页面获取编号。编写此规则时,将根据目标电台的最新更新小说进行设置,采集更新时将自动采集对方的小说,并且还将关注其他人的小说网站。
1.根据目标台的ID 采集设置ID范围,直到通常另一方的书采集的特殊采集是采集时才使用。
2.根据目标台ID 采集,当特殊采集是另一方的书采集时,直到通常需要采集时才很少使用它。
3.点击了他的网站的小说ID 采集,在点击之前,他必须先更新其中一部网站小说,但是模板网站可能没有这本书,因此采集看起来非常好慢。很少使用,基本上没有用。
4.在日志记录的底部,必须选择此项以记录采集新颖信息,这些信息无缘无故不会出现在采集中。还必须选择循环采集。如果这是自动采集,请确保采集器自动循环另一方的采集。循环时间设置取决于您自己的需求。我通常将其设置为十分钟。如果您想将采集设置为零。
设置采集
[添加新书]:添加书时添加;
[谨慎使用]:以下两个单词是比较模板站的章节名称。如果正确,请继续。 采集如果不正确,将其清空,然后单击采集。不要使用它,这会导致严重的问题。有时候,意外清空我在百度收录上使用过的页面是一个悲剧。对于其他一些功能,可以阅读文字;
[设置2]:这是比较章节的选择,无论如何,它们几乎是相同的,为什么我没有什么不同?您可以默认;
[空章节的处理方法]:这意味着模板站点上的某些小说是空的,具体取决于您的需要,但是请注意,您不应选择第二本来跳过本章,因为跳过本章会留下章节名称为空,下次采集,如果将较少的章节名称与模板站进行比较,则该章节名称将无法更新书籍;
[章节安排]:这取决于目标站的图,这更加复杂。我给您的采集规则按目标电台的顺序排列。不要选择任何东西,通常使用[目标电台顺序]和[按照章节ID的顺序],不要使用其他内容。这两个不会有问题,我将为您提供默认设置;
[过滤器设置]:取决于您需要设置的内容,字面意思很明确;
[删除水印]:这基本上是不必要的;
[Agent],[Progress]:通常将上述三个数字设置为000;
这样,采集很快。代理IP是您阻止的目标站点的采集,然后在Internet上找到一些代理,打开代理功能,然后单击采集。
我已经在这里讨论了其中一些功能,而其他功能则是一些辅助功能,您以后可以进一步了解。
下一步,进行设置,然后单击以启动采集。选择规则,然后选择要按采集 采集输入的内容,然后单击以开始;
如果出现提示“成功启动采集模式”,则可以查看网站是否已更新。
PS:如果文本教程不能使您清楚地了解操作方法,请下载视频以帮助理解。
此资源的下载价格为0. 1德国货币,请先登录
打开VIP会员并免费下载所有站点资源!该程序仅用于测试,不能用于商业用途!如有任何疑问,请联系我们!