技术文章：杰奇CMS小说关关采集器配置教程(文字+视频) 免费下载

优采云发布时间: 2020-09-07 02:40

　　节气cms Novel Guan Guan 采集器配置教程（文字+视频）免费下载

　　[Jie Qi cms Novel Guan Guan 采集器 Configuration Tutorial Video]我不知道何时获得它。我看到该视频可能是V9版本，但是您可以参考当前流行的主要版本。由于许多设置技术是相同的，因此我们在这里共享它们。顺便说一句，我还发布了我采集的教程的文本版本，以供您参考。

　　目录介绍

　　规则文件夹，日志文件夹：

　　规则是我们推迟采集条规则的地方；

　　log是一个日志文件，也就是说，当采集器出错时，它将记录错误的信息。当我们看到这一点时，我们知道采集在哪里错误；

　　现在，我们单击开关以关闭采集器，直接打开NovelSpider.exe，然后可以启动开关采集器。（注意：打开过程会有点慢，因此请单击一次并稍等片刻。请勿单击再次打开，否则一段时间采集器后将打开多个级别！）

　　在某些级别上会有一个提示框，因此我们不在乎。

　　系统设置

　　打开后，我们应立即修改“设置（S）”→系统设置。：

　　1.修改本地网站目录，例如，我的目录位于D：\ xiaoshuo

　　2.再次修改数据库连接字符串

　　DataSource = 12 7. 0. 0. 1;

　　Database =数据库名称；

　　UserID =数据库管理用户名；

　　Password =数据库管理密码；

　　port = 3306;

　　charset = gbk

　　上面的设置是为了关闭采集器，这是您第一次使用它，您需要对其进行设置，而无需在设置后再次进行设置。

　　分类设置

　　首先：类别设置通常对应于类别，这些对应于您的网站类别。例如

　　1 | Fantasy Fantasy =，幻想，幻想，魔术，魔术，幻想魔术，幻想幻想，幻想小说，幻想·魔术，幻想世界，幻想幻想，

　　1是您的网站第一个蓝色稻米幻想幻想。等号是采集目标网站可能遇到的分类之后，越详细越好，某些模板网站对应于您的幻想幻想。如果您没有幻想模板，只需添加它即可。

　　第二个：是设置中的一代

　　默认情况下无需修改。第一个生成的内容页面html是您的网站小说目录页面的html。如果您网站使用伪静态，则不需要生成它。生成的第二个内容页面html是单击小说的内容以查看小说的文本章节。这与上面的第一个相同。如果您网站使用伪静态，则不需要生成它。

　　如果要构建静态小说网站，则需要生成它，这非常消耗硬盘。通常，一千本小说需要几GB的空间。

　　第三：生成全文阅读。不用担心，通常不使用。

　　第四：生成OPF。必须生成此文件，否则无法打开网站，并且如果未生成您的小说网站，也会出现打开错误。只需在此处打勾。不用担心其他设置，没有特殊要求您将无法使用它们。（注意：[Settings-e-book settings]不需要控制，默认值就足够了，因此不要选择对勾，设置中的图片设置也是默认值，因此不要选择对勾。）

　　第五：文字广告。如果要在新颖内容中添加广告，则可以在此处添加内容。您需要选择第一个存储章节以添加文字广告。实际的存储空间会将您的广告添加到您采集下的小说中，这些路径的txt文件中的文件/ article / txt / 0/1

　　这是您的小说，是一部移动版本，因此您需要选择第一本。添加广告时，您会在章节阅读中看到它，但不要使用这些功能。

　　第六：其他[过滤和替换]，[文本到图片]。无需控制

　　第七：日志选择。勾选所有人。这是采集遇到的错误的日志。您可以基于此消除错误。

　　规则测试

　　单击规则进入规则管理器，我们选择我们不能做的三角形符号，下拉并选择要测试的规则，单击右侧的加载，然后单击“测试规则”，如果出现“是要获取ID和小说名称”，则会弹出一个界面

　　这是为了获得包括小说名称分类介绍和封面在内的小说信息内容。

　　某些网站信息不完整采集。如果我们采集回来，它将显得不完整。这没有作用。您可以阅读小说的主要章节。然后是获得采集的章节，这是获得小说的内容。

　　这是一个很好的采集规则。我们可以使用采集规则更新采集小说。

　　如何采集

　　通常，我们使用标准的采集模式。

　　当我们单击“ 采集 –标准采集模式”时，有时会出现错误消息。无论我们单击采集框架中的规则，它都会出现在正确的位置，并且还会出现一些其他提示。忽略他，只需单击[继续]。

　　输入标准采集后输入正确的姿势后，通常使用第一个根据目标测站页面获取编号。编写此规则时，将根据目标电台的最新更新小说进行设置，采集更新时将自动采集对方的小说，并且还将关注其他人的小说网站。

　　1.根据目标台的ID 采集设置ID范围，直到通常另一方的书采集的特殊采集是采集时才使用。

　　2.根据目标台ID 采集，当特殊采集是另一方的书采集时，直到通常需要采集时才很少使用它。

　　3.点击了他的网站的小说ID 采集，在点击之前，他必须先更新其中一部网站小说，但是模板网站可能没有这本书，因此采集看起来非常好慢。很少使用，基本上没有用。

　　4.在日志记录的底部，必须选择此项以记录采集新颖信息，这些信息无缘无故不会出现在采集中。还必须选择循环采集。如果这是自动采集，请确保采集器自动循环另一方的采集。循环时间设置取决于您自己的需求。我通常将其设置为十分钟。如果您想将采集设置为零。

　　设置采集

　　[添加新书]：添加书时添加；

　　[谨慎使用]：以下两个单词是比较模板站的章节名称。如果正确，请继续。采集如果不正确，将其清空，然后单击采集。不要使用它，这会导致严重的问题。有时候，意外清空我在百度收录上使用过的页面是一个悲剧。对于其他一些功能，可以阅读文字；

　　[设置2]：这是比较章节的选择，无论如何，它们几乎是相同的，为什么我没有什么不同？您可以默认；

　　[空章节的处理方法]：这意味着模板站点上的某些小说是空的，具体取决于您的需要，但是请注意，您不应选择第二本来跳过本章，因为跳过本章会留下章节名称为空，下次采集，如果将较少的章节名称与模板站进行比较，则该章节名称将无法更新书籍；

　　[章节安排]：这取决于目标站的图，这更加复杂。我给您的采集规则按目标电台的顺序排列。不要选择任何东西，通常使用[目标电台顺序]和[按照章节ID的顺序]，不要使用其他内容。这两个不会有问题，我将为您提供默认设置；

　　[过滤器设置]：取决于您需要设置的内容，字面意思很明确；

　　[删除水印]：这基本上是不必要的；

　　[Agent]，[Progress]：通常将上述三个数字设置为000；

　　这样，采集很快。代理IP是您阻止的目标站点的采集，然后在Internet上找到一些代理，打开代理功能，然后单击采集。

　　我已经在这里讨论了其中一些功能，而其他功能则是一些辅助功能，您以后可以进一步了解。

　　下一步，进行设置，然后单击以启动采集。选择规则，然后选择要按采集采集输入的内容，然后单击以开始；

　　如果出现提示“成功启动采集模式”，则可以查看网站是否已更新。

　　PS：如果文本教程不能使您清楚地了解操作方法，请下载视频以帮助理解。

　　此资源的下载价格为0. 1德国货币，请先登录

　　打开VIP会员并免费下载所有站点资源！该程序仅用于测试，不能用于商业用途！如有任何疑问，请联系我们！

0

2020-09-07

文章cms采集

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

技术文章：杰奇CMS小说关关采集器配置教程(文字+视频) 免费下载

0 个评论

发起人

AI时代内容工厂

技术文章：杰奇CMS小说关关采集器配置教程(文字+视频) 免费下载

0 个评论

发起人

相关问题