网页新闻抓取(PDF文档拆分的方式,但让PDF问题迎刃而解。)
优采云 发布时间: 2022-01-31 12:22网页新闻抓取(PDF文档拆分的方式,但让PDF问题迎刃而解。)
福昕高级 PDF 编辑器涵盖整个文档生命周期,集成了创建、编辑、注释、协作/共享、保护、页面管理、导出、扫描和光学字符识别 (OCR) 以及签署 PDF 文档和表单等基本功能。还有一些高级功能,例如高级编辑、发起共享审阅、高级加密、高压缩、PDF A/E/X 创建和添加贝茨编号。使用福昕高级 PDF 编辑器解决 PDF 问题。
在之前的操作分享中,我们介绍了拆分PDF文档的方式,但是文档拆分不同于页面提取~
文档拆分是将一个完整的PDF文档拆分为多个PDF文件;而页面提取是从完整的PDF文档中提取一些页面。
以电子书的相关操作为例:
当团队需要合作翻译电子书时,可以通过文档拆分将电子书按章节拆分成多个PDF文件;
当你在电子书中看到一段很精彩的片段,想分享给你的朋友时,更适合使用提取页面的功能~
适当使用提取页面的方法,不仅可以减轻文件存储的负担,还可以更快的找到想要的内容!接下来,我们来学习如何提取PDF文档的部分页面~
打开“提取”功能区,自定义页面范围
第一步是在Foxit PhantomPDF中打开需要提取页面的PDF文档,点击功能区中的“页面管理”选项卡,选择“提取”进入详细的页面提取操作。
在“提取页面”对话框中,您可以选择页码范围。您只需在“页面”功能框中填写您要提取的页面即可。连续页用“-”表示,分开的页用“,”表示。需要注意的是,这里要使用“,”号。哦英文的。(例如,如果要提取PDF文档的第1、4到9、12页,只需在方框中填写“1,4-9,12”即可。)
另*敏*感*词*后,还可以在“提取”中选择提取上述范围的子集,如“范围内的所有页面”、“仅偶数页”或“仅奇数页”。(如果要提取PDF文档第1、4到9、12页的偶数页,则在“提取”选项中选择“仅偶数页”,然后最后生成的文档收录原创文档的第 4、6、8 和 12 页。)
如果不知道要选择哪些页面,可以勾选左下角的“显示预览”选项,在“提取页面”窗口中预览文件页面,方便查看。
福昕高级 PDF 编辑器下载链接: