免费网页采集器( 善肯网页TXT采集器是款专业换行的网页文本采集工具 )
优采云 发布时间: 2022-01-01 22:09免费网页采集器(
善肯网页TXT采集器是款专业换行的网页文本采集工具
)
山垦网页TXT采集器是一款专业、小巧的网页文本采集工具。山垦网TXT采集器可以帮助用户查找一些网站小说文章,通过专业的正则表达式过滤,去除不需要的内容,非常简单实用。欢迎大家体验jz5u!
使用说明
1、规则设置:
①在规则设置窗口,随便找一篇网站的文章,不写任何规则,先点实时预览看能不能拿到网页源码,然后写如果可以,规则。没有必要继续了。
②规则设置使用正则表达式匹配内容。最好有一定的基础。如果你没有基础,也可以参考给出的例子。简单学习不需要深入学习正则表达式。
③设置规则时,目录页和内容页需要分开预览,也需要两个链接,一个目录页链接和一个内容页链接。
④ 关于替换,有一般替换和自定义替换。目前不需要正则化,普通替换即可。需要注意的是必须输入值,空格也是可以的。删除:选择整行,然后按住删除键。当内置的\n用作替换数据时,表示换行。
⑤编码,目前只设置了GBK和UFT-8,几乎大部分网站都是这两种编码之一。
2、分析和
①解析请按2键解析地址。按钮1目前是任意的,不想被删除,其他功能后续开发。
②支持单章和全文。
③支持添加章节号【部分小说无章节号时可以查看】
④支持阅读,但需要联网。此功能只是辅助功能,并非专业的小说阅读软件。
⑤显示进度和总时间,内置多线程。
3、关于软件
①其实你只需要.exe,规则都是自己添加的,commonrule.xml中收录了常用的替换规则。 网站规则在规则文件夹中。我在里面放了两条网站规则,主要是为了测试。其他网站规则,可以自己添加,也可以支持开发者。
②软件未打包,c#开发,无病毒。如果你不担心,请不要使用它,我不会收回它。
③ 关于软件中跳转到论坛的问题,我亲自测试跳转时360提示的。也可能是因为跳转到了360浏览器。不知道你会不会遇到这个问题。
④如果不知道xml中的内容,请勿触摸,以免软件无法识别并报错。