技术文章:杰奇CMS小说关关采集器配置教程(文字+视频) 免费下载

优采云 发布时间: 2020-09-07 02:40

  节气cms Novel Guan Guan 采集器配置教程(文字+视频)免费下载

  [Jie Qi cms Novel Guan Guan 采集器 Configuration Tutorial Video]我不知道何时获得它。我看到该视频可能是V9版本,但是您可以参考当前流行的主要版本。由于许多设置技术是相同的,因此我们在这里共享它们。顺便说一句,我还发布了我采集的教程的文本版本,以供您参考。

  目录介绍

  规则文件夹,日志文件夹:

  规则是我们推迟采集条规则的地方;

  log是一个日志文件,也就是说,当采集器出错时,它将记录错误的信息。当我们看到这一点时,我们知道采集在哪里错误;

  现在,我们单击开关以关闭采集器,直接打开NovelSpider.exe,然后可以启动开关采集器。 (注意:打开过程会有点慢,因此请单击一次并稍等片刻。请勿单击再次打开,否则一段时间采集器后将打开多个级别!)

  在某些级别上会有一个提示框,因此我们不在乎。

  系统设置

  打开后,我们应立即修改“设置(S)”→系统设置。 :

  1.修改本地网站目录,例如,我的目录位于D:\ xiaoshuo

  2.再次修改数据库连接字符串

  DataSource = 12 7. 0. 0. 1;

  Database =数据库名称;

  UserID =数据库管理用户名;

  Password =数据库管理密码;

  port = 3306;

  charset = gbk

  上面的设置是为了关闭采集器,这是您第一次使用它,您需要对其进行设置,而无需在设置后再次进行设置。

  

  分类设置

  首先:类别设置通常对应于类别,这些对应于您的网站类别。例如

  1 | Fantasy Fantasy =,幻想,幻想,魔术,魔术,幻想魔术,幻想幻想,幻想小说,幻想·魔术,幻想世界,幻想幻想,

  1是您的网站第一个蓝色稻米幻想幻想。等号是采集目标网站可能遇到的分类之后,越详细越好,某些模板网站对应于您的幻想幻想。如果您没有幻想模板,只需添加它即可。

  第二个:是设置中的一代

  默认情况下无需修改。第一个生成的内容页面html是您的网站小说目录页面的html。如果您网站使用伪静态,则不需要生成它。生成的第二个内容页面html是单击小说的内容以查看小说的文本章节。这与上面的第一个相同。如果您网站使用伪静态,则不需要生成它。

  如果要构建静态小说网站,则需要生成它,这非常消耗硬盘。通常,一千本小说需要几GB的空间。

  第三:生成全文阅读。不用担心,通常不使用。

  第四:生成OPF。必须生成此文件,否则无法打开网站,并且如果未生成您的小说网站,也会出现打开错误。只需在此处打勾。不用担心其他设置,没有特殊要求您将无法使用它们。 (注意:[Settings-e-book settings]不需要控制,默认值就足够了,因此不要选择对勾,设置中的图片设置也是默认值,因此不要选择对勾。)

  第五:文字广告。如果要在新颖内容中添加广告,则可以在此处添加内容。您需要选择第一个存储章节以添加文字广告。实际的存储空间会将您的广告添加到您采集下的小说中,这些路径的txt文件中的文件/ article / txt / 0/1

  这是您的小说,是一部移动版本,因此您需要选择第一本。添加广告时,您会在章节阅读中看到它,但不要使用这些功能。

  第六:其他[过滤和替换],[文本到图片]。无需控制

  第七:日志选择。勾选所有人。这是采集遇到的错误的日志。您可以基于此消除错误。

  

  规则测试

  单击规则进入规则管理器,我们选择我们不能做的三角形符号,下拉并选择要测试的规则,单击右侧的加载,然后单击“测试规则”,如果出现“是要获取ID和小说名称”,则会弹出一个界面

  这是为了获得包括小说名称分类介绍和封面在内的小说信息内容。

  某些网站信息不完整采集。如果我们采集回来,它将显得不完整。这没有作用。您可以阅读小说的主要章节。然后是获得采集的章节,这是获得小说的内容。

  这是一个很好的采集规则。我们可以使用采集规则更新采集小说。

  

  如何采集

  通常,我们使用标准的采集模式。

  当我们单击“ 采集 –标准采集模式”时,有时会出现错误消息。无论我们单击采集框架中的规则,它都会出现在正确的位置,并且还会出现一些其他提示。忽略他,只需单击[继续]。

  输入标准采集后输入正确的姿势后,通常使用第一个根据目标测站页面获取编号。编写此规则时,将根据目标电台的最新更新小说进行设置,采集更新时将自动采集对方的小说,并且还将关注其他人的小说网站。

  1.根据目标台的ID 采集设置ID范围,直到通常另一方的书采集的特殊采集是采集时才使用。

  2.根据目标台ID 采集,当特殊采集是另一方的书采集时,直到通常需要采集时才很少使用它。

  3.点击了他的网站的小说ID 采集,在点击之前,他必须先更新其中一部网站小说,但是模板网站可能没有这本书,因此采集看起来非常好慢。很少使用,基本上没有用。

  4.在日志记录的底部,必须选择此项以记录采集新颖信息,这些信息无缘无故不会出现在采集中。还必须选择循环采集。如果这是自动采集,请确保采集器自动循环另一方的采集。循环时间设置取决于您自己的需求。我通常将其设置为十分钟。如果您想将采集设置为零。

  

  设置采集

  [添加新书]:添加书时添加;

  [谨慎使用]:以下两个单词是比较模板站的章节名称。如果正确,请继续。 采集如果不正确,将其清空,然后单击采集。不要使用它,这会导致严重的问题。有时候,意外清空我在百度收录上使用过的页面是一个悲剧。对于其他一些功能,可以阅读文字;

  [设置2]:这是比较章节的选择,无论如何,它们几乎是相同的,为什么我没有什么不同?您可以默认;

  [空章节的处理方法]:这意味着模板站点上的某些小说是空的,具体取决于您的需要,但是请注意,您不应选择第二本来跳过本章,因为跳过本章会留下章节名称为空,下次采集,如果将较少的章节名称与模板站进行比较,则该章节名称将无法更新书籍;

  [章节安排]:这取决于目标站的图,这更加复杂。我给您的采集规则按目标电台的顺序排列。不要选择任何东西,通常使用[目标电台顺序]和[按照章节ID的顺序],不要使用其他内容。这两个不会有问题,我将为您提供默认设置;

  [过滤器设置]:取决于您需要设置的内容,字面意思很明确;

  [删除水印]:这基本上是不必要的;

  [Agent],[Progress]:通常将上述三个数字设置为000;

  这样,采集很快。代理IP是您阻止的目标站点的采集,然后在Internet上找到一些代理,打开代理功能,然后单击采集。

  

  我已经在这里讨论了其中一些功能,而其他功能则是一些辅助功能,您以后可以进一步了解。

  下一步,进行设置,然后单击以启动采集。选择规则,然后选择要按采集 采集输入的内容,然后单击以开始;

  如果出现提示“成功启动采集模式”,则可以查看网站是否已更新。

  PS:如果文本教程不能使您清楚地了解操作方法,请下载视频以帮助理解。

  

  此资源的下载价格为0. 1德国货币,请先登录

  打开VIP会员并免费下载所有站点资源!该程序仅用于测试,不能用于商业用途!如有任何疑问,请联系我们!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线