Shanken Web TXT采集器V1.0最新免费绿色版
优采云 发布时间: 2020-08-07 21:24Shanken网页TXT采集器是由我的爱之神破解论坛制作的网页采集工具. 该软件非常强大且实用. 它使用全新的正则表达式来捕获下载的内容,并且该新颖站点已加密或无法及时复制. 粘贴可以成功采集,可以下载,可以实时预览,可以被文本替换,并且可以将每个章节保存为TXT文件,非常实用,欢迎有需要的朋友使用.
软件简介:
在发展之初,这是为了阅读小说. 我个人喜欢在本地下载它以便慢慢观看,但是许多新颖的网站不支持下载或下载限制(非VIP小说). 我还在论坛上找到了一些采集器,但是就我个人而言,它并不容易使用. 输入正则表达式后,该章将出现,但是当我单击下载时无法下载文本. 完成软件后,我继续测试软件. 相同的正则表达式与那些软件不匹配. 内容已输出,因此下载失败. 该软件还可能具有一些我不知道的规则,但结果是它无法完成我想要的下载. 我什至不知道这是规则,软件还是网站设置...
因此,我开发的此软件专门添加了预览功能,您可以知道是否可以获取网页数据,获取后是否可以正确匹配内容.
功能介绍:
1. 规则设置:
①在规则设置窗口中,无需编写任何规则即可在网站上找到文章. 首先单击实时预览以查看是否可以获取网页的源代码. 如果可以得到,请编写规则. 如果无法获得,则无需继续. 上
②规则设置使用正则表达式匹配内容. 最好有一定的基础. 如果没有基础,也可以参考给出的示例. 简单学习不需要深入研究正则表达式.
③设置规则后,需要分别预览目录页面和内容页面,这还需要两个链接,即目录页面链接和内容页面链接.
④关于替换,有常规替换和自定义替换. 目前无需进行正规化,普通替代品就可以了. 应该注意的是,必须输入值,并且空格也是可以接受的. 删除: 选择整行,然后按住删除键. 当内置\ n用作替换数据时,表示换行.
⑤编码,目前仅设置了GBK和UFT-8,几乎大多数网站都是这两种编码之一.
2,分析和下载
①要进行分析,请按2按钮解析地址. 按钮1当前功能强大,不希望被删除,稍后将开发其他功能.
②支持单章下载和全文下载.
③支持添加章节号[某些小说中没有章节号时可以检查]
④支持在线观看,但是需要连接到互联网. 此功能仅是辅助工具,不是阅读小说的专业软件.
⑤显示下载进度和总时间,内置多线程.
3. 关于软件
①实际上,您只需要.exe,规则全部由您自己添加,commonrule.xml收录常见的替换规则. 网站规则位于规则文件夹下. 我在其中放置了两个网站规则,主要用于测试. 您可以自己添加其他站点规则,或支持开发人员.
②该软件未打包,由c#开发,没有病毒. 如果您不担心,请不要使用它,我不会收回它.
③关于该软件,跳至论坛. 当我亲自测试跳转时,360提示了我. 这也可能是因为跳转是针对360浏览器进行的. 我想知道您是否会遇到这个问题.
④如果您不知道xml中的内容,请不要触摸它,以免软件识别失败和错误.
⑤需要.net framework 4.5或更高版本的框架支持. 如果您的计算机没有安装,则需要下载并安装它. 框架不大.
4. 其他
我暂时没想到,我稍后会考虑.
最后,无论如何,我仍然四处寻求支持,如果您不喜欢也不要喷洒.
这是第一个版本,因此必须存在以前的测试中未遇到的错误或需要优化的问题. 欢迎提供温和的反馈.
从理论上讲,从目录页面到内容页面的任何形式都可以使用,不仅限于小说.