抓取网页生成电子书(制作自己的学习手册,永久保存互联网信息*早前PriceTag)
优采云 发布时间: 2022-02-23 16:15抓取网页生成电子书(制作自己的学习手册,永久保存互联网信息*早前PriceTag)
制作自己的学习手册并永久保存互联网信息
* 较早价格标签的合约,文字已被删除
关于文章和信息组织,一个常见的需求是保存某个主题的多篇文章文章,或者一个博客或教程的所有网页,做成类似出版物的电子出版物。可以在手机、平板电脑上阅读或永久保存的书籍。实现此要求的一种方法是使用 Chrome 插件一键将目标网页保存为 ePub 文件。
ePub 的插件大约有十种。经过大量的测试,我最终选择了dotEPUB、WebToWpub、EpubPress、Save as eBook这四个各有侧重、效果更好的插件。本文将分析它们的特点,以帮助您确定哪一种最能满足您的需求。
四个插件的用法和特点
dotEPUB : 将当前窗口的网页另存为 ePub1. 速度:更快2. 水印:开头和结尾的水印3. 图片支持:稍差4. 排版:更好排版
dotEPUB是操作最简单、功能最单一的一种。只需点击插件栏中的 dotEPUB 图标,即可自动将当前网页下载为 ePub 文件。但由于只保存当前网页,因此适用范围较窄。
在这里,打开一个知乎栏目“我们在谈论英语学习时在谈论什么”作为素材尝试抓取,用多看App打开,阅读效果如下。需要注意的是,这个插件会在开头和结尾添加dotEPUB水印:
WebToEpub:抓取当前网页中的所有链接为章节并生成为ePub1.速度:更快,有进度条2.水印:无水印3.图片支持:有图片4.排版:排版比较通用
这是我经常使用的插件。它可以爬取当前网页中收录的链接的所有内容。适用于爬取知乎列或博客等网站以列表形式展开内容。网页中的每个链接都会生成一个特定的Epub章节,章节标题就是网页标题。
点击插件,确认开始转换后,进入插件主界面。在主界面中,WebToEpub 允许用户编辑 ePub 的标题、文件名和作者。爬取时可以手动勾选需要的链接,也可以进行多选、反选等操作,还可以反向选择网页列表。此外,您可以通过将图像地址粘贴到 URL 框中来为文件添加封面。
需要注意的是,对于一些动态加载的页面,如果要抓取所有的文章,在使用插件之前需要滚动到页面底部完全加载列表。
EpubPress:将当前打开的所有标签捕获为ePub1.速度:正常速度,带有进度条2.水印:无水印3.图像支持:在某些情况下捕获图像会失败< @4. 排版:更好的排版
这是另一个常用的插件,可以保存浏览器当前打开的所有标签页,每个标签页是一个章节。与WebToEpub相比,EpubPress的设置选项比较简单,可以输入标题和描述,查看想要的网页。
此外,EpubPress 还支持以 mobi 格式保存,并支持将捕获的文件发送到电子邮件地址,可根据需要在右上角的设置中选择。
如果爬取大量标签页,等待时间会明显变长。另请注意,在实际测试中可能无法保存超过 20 个选项卡。
另存为电子书:选择打开的网页并保存为 ePub1. 速度:更快2. 水印:无水印3. 图片支持:带图片4. 排版:更好排版
另存为 eBook 与 EpubPress 类似,都将打开的选项卡保存为 ePub 文件中的章节。但要保存为电子书,需要在浏览网页时点击要保存的网页插件栏中的图标,选择“另存为章节”。标记后,单击“编辑章节”将这些网页保存为 ePub 文件。
在主界面中,您可以编辑文件的标题和调整章节的顺序。
四种使用场景
总结一下四个插件的适用场景,这里简单总结一下情况:
总结
将网页保存为 ePub 电子书以供阅读是除了 Evernote 和 Read Later 等工具之外的另一个想法。对于严肃或系统的内容,制作一本ePub电子书,三两下进行主题阅读会更加连贯,思考可以逐步深化主题。这是电子书和印象笔记以及后来阅读的区别。观点。因此,对于系统学习来说,ePub电子书无疑是一个不错的选择。
回到Chrome插件的话题,一键生成ePub文件的插件普遍的缺点是通过插件制作的电子书不是纯图文,还有一些不相关的内容,如网站中的超链接或评论@> 也可能被 网站 阻止。@收录进入电子书,导致转换效果不佳。文章只提到了目前水平不错的四种ePub转换插件,各有各的不足。
您可以根据个人需求组合两个或多个插件完成ePub转换。