抓取网页数据工具(myBaseforMac(分类管理自由格式数据库软件)推荐给大家)
优采云 发布时间: 2021-09-28 18:14抓取网页数据工具(myBaseforMac(分类管理自由格式数据库软件)推荐给大家)
myBase 7.3 发布更新!myBase 是一种独特的自由格式数据库软件,允许输入非结构化文本、网页、图像、文档、电子邮件甚至任意文件,无论长度或格式如何。所有信息将被自动压缩并以树状结构的轮廓形式存储。欢迎感兴趣的朋友下载体验macdown!
myBase for Mac(用于分类管理的免费格式数据库软件)
现在就下载
myBase for Mac(分类管理的自由格式数据库软件)推荐给大家!通过myBase7.3,您可以轻松快捷地构建多层次、多维度、交叉引用、快速查询、层次分明、清晰的个人知识库
2019-05-0925.84 MB 简体中文
如何从浏览器中抓取网页内容和图片并将它们保存到 myBase 数据库中?
内置网页编辑器,支持直接从浏览器复制粘贴网页内容到数据库,粘贴内容时会尝试自动下载网页中的图片,保存在Base64编码的HTML内容中;如果由于某种原因图片下载失败,例如网站限制图片访问,您可以根据需要手动复制单张图片,然后粘贴到页面相应位置;
另外,部分网站可能需要通过http或socks5代理服务器访问,v7.x b-24+增加了代理服务器设置,可以在选项框中设置
Webcollect插件:除了直接复制粘贴外,还可以考虑安装Webcollect浏览器扩展,在浏览器的右键菜单中添加【Save with myBase】;最新版本的 Webcollect 支持 Firefox/Chrome 浏览器,并且是跨系统平台通用的。Linux、MacOSX、Windows三大主流系统平台;
对于火狐浏览器,可以在myBase中选择Tools-Install Webcollect host for Firefox菜单,然后按照说明在火狐浏览器中打开火狐扩展应用商店,在火狐浏览器中添加Webcollect插件即可完成安装;
Chrome浏览器可以在myBase中选择Tools-Install Webcollect host for Chrome菜单,然后在Chrome浏览器中按照说明打开Chrome扩展应用商店,在Chrome浏览器中添加Webcollect插件即可完成安装;
安装成功后,浏览器右键菜单会自动添加【用myBase7.x保存】;在浏览网页时,您可以使用此工具将页面内容保存到 myBase 数据库中。
新版Webcollect插件采用全新的数据通讯接口,可跨平台使用。支持 myBase 7.0 Beta-26 (Linux, MacOSX, Windows) 及更高版本;旧版本无法感知/接收新版本Webcollect网页内容传输的数据;请务必同时将myBase和WebCollect升级到最新版本,以实现网页保存功能;
注意:如果要保存的网页布局/格式复杂,嵌入的图片元素较多,建议先选择页面的核心内容,尽量排除侧边栏广告等不必要的元素,然后复制或抓取选中的片段,减少不相关图片的下载和资源消耗,同时提高页面内容抓取的成功率;
以上就是小编为大家带来的如何从浏览器中抓取网页内容和图片并保存到myBase数据库中?有需要的朋友,欢迎下载体验macdown!