抓取网页生成电子书(主流电子书格式大家最为熟知的电子书熟知格式(图))

优采云 发布时间: 2021-12-27 08:10

  抓取网页生成电子书(主流电子书格式大家最为熟知的电子书熟知格式(图))

  编者按(@Minja):在写文章的时候,我们经常需要引用和返回。对各种存档和编辑工具的不满,让我萌生了自己制作电子书的念头。恰巧@Spencerwoo在这方面有扎实的折腾能力,于是摆脱了他,一起研究了一套简单易行的方法,写了一篇文章与大家分享。

  网络世界虽然有很多有价值的文章,但并不是每一次阅读体验都令人满意。如果您想拥有出色的文章阅读体验,您至少必须确保我们正在阅读的文章:

  很多时候,我们依靠浏览器的阅读方式,或者Pocket和RSS客户端来阅读。但是,稍后无法对阅读模式进行排序。大多数阅读服务的全文搜索功能需要付费,网上的文章可能有一天找不到了。也许,将文章以电子书的形式保存在本地是一种更方便的回溯选择。

  如果我们在网上看到一个网页形式的电子书,想把整个网页直接保存在本地(俗称“剪辑”),那会很麻烦。现有的网络剪辑工具不仅可能夹带无用的广告和其他影响体验的冗余区域,还可能丢失重要和有价值的内容。不仅如此,几乎没有任何工具可以轻松抓取图片并自定义本地保存的文章样式。那么,让我向您介绍一套免费制作个性化电子书的方法。

  本文主要使用开源工具Pandoc。对于需要MOBI或PDF格式电子书的读者,文章后半部分也有简单的转换方法。

  以ePub电子书为突破口

  主流的电子书格式有很多,但本文主要推荐ePub,它相对开放通用,可以方便地转换为其他格式。

  

  主流电子书格式

  或许最著名的电子书格式是纯文本TXT格式,但TXT之所以被称为“纯文本”,是因为它不支持章节、图片、封面和超链接。为了让电子书有格式、有图片、有内容,目前常见的电子书通常有PDF、ePub、MOBI三种格式。在:

  我们这篇文章的主要目的是利用接下来要介绍的工具,制作一个清晰美观的电子书,内嵌图片、目录、美图。相对而言,ePub 更加灵活,目录和自定义布局一应俱全,另外两种格式转换也方便。本文将从它开始。

  

  电子书效果制作

  [……]

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线