不用采集规则就可以采集( 教你编写杰奇后台采集规则都是自己的经验 )
优采云 发布时间: 2022-01-02 18:09不用采集规则就可以采集(
教你编写杰奇后台采集规则都是自己的经验
)
杰奇采集规则原创版大家好,今天正在努力教大家如何写杰奇背景采集规则绝对是我自己的经验,不是从网上复制的,而且我也比网上的会详细,不多说了,先开始写br先添加新的杰奇采集规则然后看杰奇规则描述系统默认变量articleid-文章 序列号chapterid 章节序列号subarticleid 文章子序列号subchapterid Chapter 子序列号系统标签可以替换任何字符串系统标签可以替换任何字符串除了和系统标签可以替换任何字符串除了“”系统标签可以替换数字以外的字符和字符串系统标签可以将数字字符串 采集 规则中需要获取的内容替换为四个以上的系统标签。最后说一下网站的logo。在这里大家可以写这个。 网站 标志为白色。它是 采集 规则的文件名。 网站 名字大家也可以随便写。这里是写如果你要采集的名字,我就写网站想象小说网吧的名字。我将以 wwwxxtxtnet 为例。 网站 地址在这里,填写网站 Main 域名为wwwxxtxtnet文章。子序列号计算方法。这里我们填写 floorarticleid1000。我们填写 floorarticleid1000。就这样。我们还没有弄清楚如何计算它。我们还没有弄清楚如何计算它。我们没有弄清楚如何计算它。于标方采集将此选项设置为“是”,自动检测对方网页代码。这些都是简单的斗争,所以我不会做太多解释。让大家学习一下,我们先打开wwwxxtxtnet,然后随意打开一本小说,然后跳转到文章的信息页。什么是扫盲信息页?信息页为每本书、决算、暑假、读好书、辞职、个人欠费起诉书范文 支部书记述职陈述信息展示页包括文章作者、作者姓名文章、文章的更新状态等。本书的基本总结。让我们在这里继续。我只会打开主页。一本书《挑选一个保定女孩》看到它的信息页地址是wwwxxtxtnetbook5401html,现在是扫盲时间。怎么看信息页的地址?它位于 IE 顶部,显示页面地址。只知道信息页地址或者如果不行,我们需要让Jackie知道,所以我们需要用Jackie的标签替换里面那些动态的东西。现在我们需要把这个地址改成 wwwxxtx 为什么 tnetbookarticleidhtml 会这样写?因为我们的wwwxxtxtnetBOOK没变,只是后面的数字变了,所以我们把那个数字换成了articleid,为什么要这样改呢?因为杰奇的文章序列号要换成articleid,规则的描述里说的很清楚。如果以后遇到,文章信息页地址为wwwxxtxtnetBOOK2256H文章题目乘法口算100题七年级有理数混合运算100题计算机1类题库二元线性方程组应用题真题或敢问精彩问题采集规则在文章信息页右击查看源代码spanstyle"font-size16pxfont-weightboldline-height150">我找到了名字。这里我们只需要获取“pick牛保定”四个字,所以我们将这四个字替换成杰奇标签。看规则就知道,包牛包顶应该换成这个所以
写成spanstyle"font-size16pxfont-weightboldline-height150"span 前面这么多数据不用管,主要是显示文字的排版,作者在这里,作者是采集 规则我们找到这个文章tdwidth "25" 的作者是如来棒 td 根据上面的我们知道作者的名字也是用来代替 tdwidth "25" 是 nbspnbsp 的 td 所以规则都是这样写的文章Type采集规则斗争扫盲文章type指的是什么?文章type指的是文章属于什么。通常有玄幻魔幻、都市言情等,就是文章这里输入想象小说网是tdwidth"25"类别 nbspnbspnbsp不要幻想魔幻td我们看源码属于奇幻魔幻,还是替换tdwidth "25"类 nbspnbspnbsp不要 td文章 类型就搞定了,我们看下一个 文章 类型比较关系表示对方有什么类型的 文章 ,然后这个网站上有什么类型,让我们替换规则。比如wwwxxtxtnet的奇幻魔法1科幻小说7就不一一举例了,你看不懂。你可以评论,问我关键词。 采集 规则,这里我们需要采集 其他关键字 不要忘记关键字采集 方法和作者的文章 名称相同。内容介绍你看懂了吗采集 规则是这里的亮点,容易出错。让我们来看看。介绍了它的spanclass“hottext”的内容。跨度核能到期后的新时代即将到来。努力变得懒惰。这里省略N个字。 brbrspanclass “热点文本”。这里需要~先写出来再解释spanclass“hottext”的内容 简介spanspanclass“hottext”这里应该用数字代替,因为~~不能代替BR等这样的代码,所以需要用什么可以替换 把内容采集标记这个内容采集这里大家一定要注意稍微错的代码。采集如果找不到你需要的,保持在注意封面图采集规则很好看这个文章的图片地址是imgsrc。过滤图片的规则非常简单。先来看看有图无封面的书,目前都是无封面的普通书。它的图片地址在这里来自想象小说网 图片是nocoverjpg。我们填上文件名就OK了。目录链接没必要填,反正我也填不上。采集奋斗,我这里偷懒了。来教大家。目录链接是指向目录地址的链接。一般点击阅读、章节、目录等。想象力是点击阅读。来看看liaclass"btnlink"href",点击直接阅读ali,按照封面图的规则写,直接拿到这个地址。liaclass"btnlink" href""点击阅读aliok就完成了。接下来,全文标注采集 规则 找整本小说看写作过程 想象一下小说网就完成了 文章 目录页地址 一键阅读 此处需要替换两个数字,5 和 54