善肯网页TXT采集器是一款来自我爱破解论坛大神出品的网页采集工具
优采云 发布时间: 2021-06-21 05:05善肯网页TXT采集器是一款来自我爱破解论坛大神出品的网页采集工具
山垦网页TXT采集器是我爱神破解论坛出品的网页采集工具。该软件非常强大和实用。它使用全新的正则表达式来捕获下载内容并及时加密小说站点。或者如果不能复制粘贴也可以成功采集。可下载,可实时预览,可替换文字,每章可另存为TXT文件,非常实用,欢迎有需要的朋友使用。
软件介绍:
开发之初,是为了方便看小说。我个人喜欢下载到本地慢慢看。不过很多小说网站不支持下载,或者有下载限制【非VIP小说】。我还在论坛上找到了一些@k2。 @,但我个人认为它不是很有用。输入正则表达式后,章节会出来,但是点击下载后无法下载文本。完成软件后,我继续测试该软件。同样的正则表达式,那些软件和内容不匹配,所以下载失败。也有可能是软件有一些我不知道的规则,但结果就是无法完成我想要的下载。不知道是规则还是软件还是网站setting的原因......
所以我专门开发的这个软件增加了预览功能,可以知道我是否能获取到网页数据,获取后是否能正确匹配内容。
功能介绍:
1、规则设置:
①在规则设置窗口,随便找一篇网站的文章,不写任何规则,先点实时预览看能不能拿到网页源码,再写规则,如果你不能得到它,什么都不需要继续。
②规则设置使用正则表达式匹配内容。最好有一定的基础。如果没有基础,可以参考给出的例子。简单易学,不需要深入学习正则表达式。
③设置规则时,目录页和内容页需要分开预览,也需要两个链接,一个目录页链接和一个内容页链接。
④ 关于更换,有一般更换和定制更换。目前不需要正则化,普通替换即可。需要注意的是,必须输入一个值,空格也是可以的。删除:选择整行,然后按住删除键。当内置的\n用作替换数据时,表示换行。
⑤编码,目前只设置了GBK和UFT-8,几乎大部分网站都是这两种编码之一。
2、分析与下载
①解析请按2键解析地址。按钮1目前任性,不想删除,其他功能后续开发。
②支持单章下载和全文下载。
③支持添加章节号【部分小说无章节号时可以查看】
④支持在线观看,但需要联网。此功能只是辅助,不是专业的小说阅读软件。
⑤显示下载进度和总时间,内置多线程。
3、about 软件
①其实你只需要.exe,规则都是自己添加的,commonrule.xml中收录了常用的替换规则。 网站 规则位于规则文件夹中。我在里面放了两条网站规则,主要是为了测试。您可以自行添加其他网站规则,也可以支持开发者。
②软件未打包,c#开发,无病毒发布。别担心,请不要使用它。
③ 关于软件中跳转到论坛的问题,我亲自测试跳转时360提示的。也可能是因为跳转到了360浏览器。不知道你会不会遇到这个问题。
④如果不知道xml中的内容,请不要碰,以免软件识别失败和错误。
⑤需要.net框架4.5以上框架支持,如果你的电脑没有,需要下载安装,框架不大。
4、其他
暂时没想到,以后会想到的。
最后,不管怎样,我还是滚来滚去求支持,不喜欢的请不要喷。
这是第一个版本,所以肯定有我之前测试没有遇到过的bug或者需要优化的问题。欢迎提供温和的反馈。
理论上,从目录页到内容页的任何形式都可以使用,不限于小说。