规则采集文章软件(小说规则捕捉器能通过小说网站的html网页源代码规则)
优采云 发布时间: 2021-10-18 20:28规则采集文章软件(小说规则捕捉器能通过小说网站的html网页源代码规则)
小说规则捕捉器可以通过小说网站的html网页源码分析关键信息的规则来抓取书籍,最终输出抓取的书籍(支持txt、ePub、zip格式输出)。有兴趣的不要错过,欢迎下载体验。
软件介绍
这个软件可以说好用也好,难用也好,比如简单地从网站中抓取书籍,直接从自带的100多个预设网站中抓取(需要浏览搜索要下载的书,然后复制链接到入口网址),无需分析复杂的源代码。对于逻辑思维能力强的用户,可以分析小说网站的源码,制定网站的捕捉规则,基本可以应对大部分小说网站。
软件特点
自定义规则抓图,可抓大部分小说网站文章,个别网站图书详细分类,支持多书抓图;
自带大量预测网站,没有定义规则的用户可以直接申请,也可以抓取自己需要的小说;
内置源码查看器,提供链接分析、关键定位、标签分割等工具;
对于大型小说,任务暂时存入数据库后,可以随意中断和恢复任务;
图书提供多种输出方式:章节文件、独立文本文件、压缩包、ePub电子书等;
支持任务导入,即从带有章节页面链接的文本文件和excel文档中导入任务进行抓取;
所有组件都支持提示信息,即光标停止后会显示相关提示。大部分操作支持状态栏提示,使用更方便;
支持添加、修改、导入、导出、排序和删除预设网站;
附赠小工具:ePub电子书制作与分解工具,支持从章节存储的书籍中生成ePub文件,也可以将ePub文件分解为多章节的文本文件。
特别说明
1 下载完成后,不要运行压缩包中的软件,直接使用,先解压;
2 软件同时支持32位和64位运行环境;
3 如果软件无法正常打开,请右键使用管理员模式运行;