谷歌浏览器自带chromewebstore的网页抓取工具.jsx提供javascriptapi
优采云 发布时间: 2022-05-30 14:05谷歌浏览器自带chromewebstore的网页抓取工具.jsx提供javascriptapi
flash网页抓取工具swfpicker,可以批量采集动态的图片格式或者视频格式的链接,采集非常的快速,可以代替网页抓取工具。直接在浏览器中打开就可以抓取动态的链接或者图片,在抓取之前要先导入字体。
谷歌浏览器自带chromewebstore,好用到不要不要的如果你用的是国内的浏览器你记得要升级,最新版是12.0,先升级到最新,
chrome上-source-and-file-autoscript
firebug可以实现抓取网页内容,无需安装任何扩展。firebug.jsx提供javascriptapi。需要注意的是,注意引号内,
这就是最经典的看见什么就去采集
现在web的发展方向是前端,抓图片已经不算什么难事,我之前写了一个爬图片网站的工具,
爬虫软件,手机app基本都有这些软件。
如果题主你真的是手头没有什么资源,那还是抓取pdf比较方便。如果题主你只是有一个整理好的收藏夹,那请使用everything吧。everything-fileindexingeverything有多种搜索选项,pdf、epub、txt、docx等等,题主可以根据自己需要进行选择。
我用过很多工具,感觉python比较方便,用filepickerdownload+beautifulsoup,