网站内容抓取工具(善肯网页TXT采集器软件免费下载介绍说明(图))

优采云 发布时间: 2022-03-04 13:14

  网站内容抓取工具(善肯网页TXT采集器软件免费下载介绍说明(图))

  本站提供山垦网页绿色免费版【小说抓取下载工具】TXT采集器软件免费下载。

  【软件截图】

  

  【基本介绍】

  山垦网页TXT采集器采用全新正则表达式小说抓取下载必备工具,支持以txt文件程序下载小说整章,并可实时预览内容,确保下载资源没有损坏和乱码。但是,这个工具只支持下载小说网站和原创作者的免费章节。

  功能模块介绍

  1、规则放置设置:

  ①在规则设置窗口中,在网站中随便找一篇文章,不要写任何规则,先用鼠标点击实时预览,看看能不能得到网页的源代码,然后如果可以的话,写下规则。如果你不能得到它,没有必要继续。

  ②规则设置使用正则表达式匹配内容。最好有一定的基础。如果没有基础,可以参考给出的例子。没有复杂的学习,就没有必要深入学习规律的规则。

  ③设置规则时,目录页和内容页需要分别预览,需要两个链接,一个目录页链接,一个内容页链接。

  ④换货方面,有普通换货和定制换货之分。这里,目前不需要正则化,普通替换即可。需要提醒的是,必须输入值,即使是空格。删除:选择整行,然后按住删除键。内置的 \n 在用作替换数据消息时表示换行符。

  ⑤编码(将信息从一种形式或格式转换为另一种的过程),目前只设置了GBK和UFT-8,几乎大部分网站都是这两种编码之一。

  2、分析下载

  ① 解析请按解析地址的按钮2。按钮1是任性的,暂时不想删除,其他功能以后再开发。

  ②支持单章下载和全文下载。

  ③支持增加章节数【部分小说没有章节数时可以勾选】

  ④支持在线查看,但需要联网。这个功能只是辅助(可以通过模拟人工手动操作实现自动杀怪、自动挂机等),不是专业的小说阅读软件。

  ⑤下载进度和总所需时间显示,内置多线程。

  3、关于软件

  ①其实只要.exe就够了,规则都是我自己加的,commonrule.xml里面有通用的替换规则。网站规则在规则文件夹中。我这里放了两条 网站 规则,主要是为了测试。其他网站规则可以自行添加,也可以支持开发者。

  ②软件非打包,c#开发,无病毒。别担心,请不要使用它,我不承担责任。

  ③关于软件,有跳转到论坛。我测试跳转的时候是360提示的,也可能是因为跳转的是360浏览器。不知道你会不会有这个问题。

  ④如果xml中的内容不清晰,请勿触摸,以免软件无法识别并报错。

  山垦网页【小说截取下载工具】TXT采集器特别说明:

  山垦网页TXT采集器采用新的正则表达式小说截取下载工具,支持将小说整章下载为txt文件,并可实时预览内容,确保下载的资源不被损坏或乱码。但是,这个工具只支持下载小说网站和原创作者的免费章节。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线