超简单实用的数据爬虫工具——Instant Data Scraper
优采云 发布时间: 2022-05-04 07:03超简单实用的数据爬虫工具——Instant Data Scraper
Instant Data Scraper是一个谷歌插件,是卖家们一款常用的数据爬虫工具,可以检测网页上的表格或者列表类型数据,并轻松的将这些数据抓取下来,作为Excel或者CSV表格文件。
关于Instant Data Scraper
Instant Data Scraper插件完全在用户的浏览器中运行,并且不会将数据发送到Web Robots。该插件可以将多页数据检索到一个文件中。
支持平台
在Amazon、eBay、Best Buy、Walmart、Etsy、Home Depot、Craigslist、Yelp 等热门网站中, Instant Data Scraper插件均可使用,并且无需使用者具备编码技能。
插件下载
1、在Chrome网上应用店搜索并安装插件“Instant Data Scraper”。
2、如无法访问 Chrome网上应用店,可以离线安装插件:
通过当前页面下载Instant Data Scraper离线安装包,打开扩展程序内的开发者模式,将解压后的crx文件拖拽至扩展程序管理,选择添加插件即可。
插件使用方法
插件使用起来非常简单,以采集亚马逊Review为例:
1、打开产品Reviews页的第一页,网址格式如:产品的ASIN;
2、点击Instant Data Scraper插件图标,激活「精灵球」;
3、「精灵球」会自动判断可抓取的页面区域,如果区域不对,点击「Try another table」按钮可以切换区域:
4、点击「Locate "Next" button」按钮来定位页面中的「Next」按钮或链接;
5、点击「Start crawling」按钮开始爬取页面,插件会实时显示爬取到数据,请耐心等待,切勿打开其他页面,不然爬取会中断出错;
6、等数据都爬取完了就可以点击绿色按钮进行下载,可选 CSV 或 Excel 文件:
7、打开下载好的CSV或Excel文件,删掉你不需要的数据列即可。
简单几步搞定亚马逊评价(Reviews)的爬取和采集!另外,Q&A 也是可以爬取的。
如何利用Instant Data Scraper插件抓取亚马逊评论?
原本这次想为大家介绍使用市面上常见的或者付费的爬虫工具,例如:优采云 、优采云、 Web Scraper等采集软件爬取亚马逊的Listing 和 Review。
直到我发现了这个Chrome插件 --Instant Data Scraper,当时我差点被感动哭了。比起学编程语言编写爬虫,自己费力去研究各种网页结构、层次,还要时刻担心自己的爬虫会被亚马逊干掉。噢!我的上帝呀,是你创造了这个插件吗?
去你的优采云!
去你的优采云!
去你的 Web Scraper!
有 Instant Data Scraper 就好了!
也不用怕网页结构改变,采集规则失效的问题了!
小白也可以轻松使用上亚马逊评价采集爬虫技术!
什么是 Instant Data Scraper?
据称此插件使用 AI (人工智能)技术,可以判断页面中最相关的内容进行抓取,并不需要你懂得晦涩的编程技术。Amazon、 eBay、Best Buy、Walmart、Etsy、Home Depot、Craigslist、Yelp 等网站都能支持。
经我初步使用,发现它不大会发生「人工智障」的问题。起码爬取亚马逊商品评论(Customer Reviews) ,Instant Data Scraper是非常方便的,大爱!
如何使用Instant Data Scraper?
在 Chrome 网上应用店搜索并安装插件「Instant Data Scraper」,此处需要科学上网。如无法访问 Chrome 网上应用店,可以离线安装插件。安装方法请自行搜索「如何离线安装 Chrome 插件?」。
插件使用起来非常非常非常简单,以采集亚马逊 Review 为例:
Instant Data Scraper
1.打开产品 Reviews 页的第一页,网址格式如:+产品的ASIN
2.点击 浏览器右上角Instant Data Scraper 插件图标,打开「精灵球」
3.「精灵球」会自动判断可抓取的页面区域,如果区域不对,点击 「Try another table」 按钮可以切换区域
4.点击「Locate "Next" button」 按钮来定位页面中的「Next」按钮或链接
5.点击「Start crawling」按钮开始爬取页面,插件会实时显示爬取到数据,请耐心等待,切勿打开其他页面,不然爬取会中断出错
6.等数据都爬取完了就可以点击绿色按钮进行下载,可选 CSV 或 Excel 文件
7.打开下载好的 CSV 或 Excel 文件,删掉你不需要的数据列即可
简单吧?7 步搞定亚马逊评价(Reviews)的爬取和采集!另外,Q&A 也是可以爬取的哦。
有了这些 Review 评论信息,我们可以利用关键词云图,如:
或者文本情感分析等大数据分析工具,快速对产品的特性和消费者情感做出大致判断,而不需要一条一条的去阅读 Review,比较适合大范围的批量选品。
Instant Data Scraper具体使用方法介绍
Instant-Data-Scraper是一款谷歌浏览器插件。
在谷歌中搜索instant data scraper, 第一个结果就是。
打开第一个搜索结果。并点击“添加至Chome”, 并在跳出的提示框中选择:添加扩展程序。
这时你的谷歌浏览器中就安装完成了我们的第一个工具。如下图所示。一个类似游泳圈的红白相间的小圆圈的标志就是。
Instant-Data-Scraper实际上是一款网页内容抓取工具。
有了他我们就可以把我们想要得到的关键词数据抓取出来。
下面我们需要思考一下,我们去哪里抓取数据呢?
其实有一个很好的平台,我们很多同行都在那里展示产品,基本做外贸的也都知道,对,就是阿里巴巴国际站。
我们就以今年比较火的一款产品来举例讲解吧。
-无纺布
即使我们不了解无纺布,百度翻译一下起码也能搞出一个关键词:nonwoven fabric.
将这个词放入阿里巴巴搜索。你会得到一个庞大的列表,我这里显示有100页。那把这100页中的词抓取出来,就可以得到我们想要的关键词。
接下来,我们点击刚才安装的instant-data-scraper扩展程序图标。
点击try another table。
将红色选择框,定位在阿里巴巴的产品搜索结果区域,如下图。
然后点击:locate “next” button按钮。
然后,在阿里搜索结果页中右键单击:翻页按钮即可。
通过这两部,一是确定抓取区域,二是确定翻页位置。
接下来instant-data-scraper,就可以工作了。
点击,操作界面中的:start scrawling
这时工具就开始抓取数据了。
注意:
至于抓取多少数据,如果你有耐心可以将这100页阿里巴巴搜索结果全部抓取完毕,也可以抓取几十页,也差不多了。时间原因我只抓取了其中的30页。
抓取完毕后,点击操作界面的:CSV或XLSX下载你想要格式的抓取结果。(我选的CSV)
将文件下载并保存至相应的磁盘位置。