抓取网页生成电子书(小说抓取下载工具_善肯网页TXT使用全新的正则表达式的小说下载工具)

优采云 发布时间: 2021-09-25 12:18

  抓取网页生成电子书(小说抓取下载工具_善肯网页TXT使用全新的正则表达式的小说下载工具)

  小说爬取下载工具_山垦网页TXT采集器 采用全新正则表达式小说爬取下载工具,支持将小说整章下载并保存为txt文件,并可实时预览内容,确保下载资源没有损坏或乱码。不过这个工具只支持下载小说网站的免费章节,支持原创作者。

  功能模块介绍

  1、规则设置:

  ①在规则设置窗口,直接在网站中找到一篇文章,不写任何规则。先点击实时预览,看看能不能拿到网页的源码。如果你能得到它,然后写规则。如果你不能得到它,就没有必要继续下去。

  ②规则设置使用正则表达式匹配内容。最好有一定的基础。如果没有基础,可以参考给出的例子。简单易学,不需要经常学习。

  ③设置规则时,目录页和内容页需要分开预览,也需要两个链接,一个目录页链接和一个内容页链接。

  ④ 关于更换,有一般更换和定制更换。目前不需要正则化,普通替换即可。需要注意的是,必须输入一个值,一个空格也可以。删除:选择整行,然后按住删除键。当内置的\n 用作替换数据时,表示换行。

  ⑤编码,目前只设置了GBK和UFT-8,几乎大部分网站都是这两种编码之一。

  2、解析下载

  ①解析请按2键解析地址。按钮1目前是任性的,不想被删除,以后会开发其他功能。

  ②支持单章下载和全文下载。

  ③支持添加章节号【部分小说无章节号时可以查看】

  ④ 支持在线观看,但需要联网。此功能只是辅助功能,并非专业的小说阅读软件。

  ⑤显示下载进度和总时间,内置多线程。

  3、关于软件

  ①其实只要.exe就够了,规则都是自己添加的,commonrule.xml中收录了常用的替换规则。网站规则在规则文件夹中。我在里面放了两条网站规则,主要是为了测试。其他网站规则可以自行添加,也可以支持开发者。

  ②软件未打包,c#开发,不含病毒。别担心,请不要使用它,我不会收回它。

  ③关于软件中跳转到论坛,我亲自测试跳转时360提示的。也可能是因为跳转的是360浏览器。不知道你会不会遇到这个问题。

  ④ 如果xml中的内容不清晰,请勿触摸,以免软件识别失败和错误。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线