超简单实用的数据爬虫工具——Instant Data Scraper

优采云 发布时间: 2022-05-04 07:03

  超简单实用的数据爬虫工具——Instant Data Scraper

  

  Instant Data Scraper是一个谷歌插件,是卖家们一款常用的数据爬虫工具,可以检测网页上的表格或者列表类型数据,并轻松的将这些数据抓取下来,作为Excel或者CSV表格文件。

  

  

  关于Instant Data Scraper

  

  

  Instant Data Scraper插件完全在用户的浏览器中运行,并且不会将数据发送到Web Robots。该插件可以将多页数据检索到一个文件中。

  

  

  支持平台

  

  

  在Amazon、eBay、Best Buy、Walmart、Etsy、Home Depot、Craigslist、Yelp 等热门网站中, Instant Data Scraper插件均可使用,并且无需使用者具备编码技能。

  

  

  插件下载

  

  

  1、在Chrome网上应用店搜索并安装插件“Instant Data Scraper”。

  2、如无法访问 Chrome网上应用店,可以离线安装插件:

  通过当前页面下载Instant Data Scraper离线安装包,打开扩展程序内的开发者模式,将解压后的crx文件拖拽至扩展程序管理,选择添加插件即可。

  

  

  插件使用方法

  

  

  插件使用起来非常简单,以采集亚马逊Review为例:

  1、打开产品Reviews页的第一页,网址格式如:产品的ASIN;

  2、点击Instant Data Scraper插件图标,激活「精灵球」;

  3、「精灵球」会自动判断可抓取的页面区域,如果区域不对,点击「Try another table」按钮可以切换区域:

  4、点击「Locate "Next" button」按钮来定位页面中的「Next」按钮或链接;

  5、点击「Start crawling」按钮开始爬取页面,插件会实时显示爬取到数据,请耐心等待,切勿打开其他页面,不然爬取会中断出错;

  6、等数据都爬取完了就可以点击绿色按钮进行下载,可选 CSV 或 Excel 文件:

  

  7、打开下载好的CSV或Excel文件,删掉你不需要的数据列即可。

  简单几步搞定亚马逊评价(Reviews)的爬取和采集!另外,Q&A 也是可以爬取的。

  

  如何利用Instant Data Scraper插件抓取亚马逊评论?

  

  原本这次想为大家介绍使用市面上常见的或者付费的爬虫工具,例如:优采云 、优采云、 Web Scraper等采集软件爬取亚马逊的Listing 和 Review。

  直到我发现了这个Chrome插件 --Instant Data Scraper,当时我差点被感动哭了。比起学编程语言编写爬虫,自己费力去研究各种网页结构、层次,还要时刻担心自己的爬虫会被亚马逊干掉。噢!我的上帝呀,是你创造了这个插件吗?

  去你的优采云!

  去你的优采云!

  去你的 Web Scraper!

  有 Instant Data Scraper 就好了!

  也不用怕网页结构改变,采集规则失效的问题了!

  小白也可以轻松使用上亚马逊评价采集爬虫技术!

  什么是 Instant Data Scraper?

  据称此插件使用 AI (人工智能)技术,可以判断页面中最相关的内容进行抓取,并不需要你懂得晦涩的编程技术。Amazon、 eBay、Best Buy、Walmart、Etsy、Home Depot、Craigslist、Yelp 等网站都能支持。

  经我初步使用,发现它不大会发生「人工智障」的问题。起码爬取亚马逊商品评论(Customer Reviews) ,Instant Data Scraper是非常方便的,大爱!

  

  

  如何使用Instant Data Scraper?

  

  

  在 Chrome 网上应用店搜索并安装插件「Instant Data Scraper」,此处需要科学上网。如无法访问 Chrome 网上应用店,可以离线安装插件。安装方法请自行搜索「如何离线安装 Chrome 插件?」。

  插件使用起来非常非常非常简单,以采集亚马逊 Review 为例:

  Instant Data Scraper

  1.打开产品 Reviews 页的第一页,网址格式如:+产品的ASIN

  2.点击 浏览器右上角Instant Data Scraper 插件图标,打开「精灵球」

  

  3.「精灵球」会自动判断可抓取的页面区域,如果区域不对,点击 「Try another table」 按钮可以切换区域

  4.点击「Locate "Next" button」 按钮来定位页面中的「Next」按钮或链接

  5.点击「Start crawling」按钮开始爬取页面,插件会实时显示爬取到数据,请耐心等待,切勿打开其他页面,不然爬取会中断出错

  6.等数据都爬取完了就可以点击绿色按钮进行下载,可选 CSV 或 Excel 文件

  

  7.打开下载好的 CSV 或 Excel 文件,删掉你不需要的数据列即可

  简单吧?7 步搞定亚马逊评价(Reviews)的爬取和采集!另外,Q&A 也是可以爬取的哦。

  有了这些 Review 评论信息,我们可以利用关键词云图,如:

  

  或者文本情感分析等大数据分析工具,快速对产品的特性和消费者情感做出大致判断,而不需要一条一条的去阅读 Review,比较适合大范围的批量选品。

  

  

  Instant Data Scraper具体使用方法介绍

  

  

  

  Instant-Data-Scraper是一款谷歌浏览器插件。

  在谷歌中搜索instant data scraper, 第一个结果就是。

  

  打开第一个搜索结果。并点击“添加至Chome”, 并在跳出的提示框中选择:添加扩展程序。

  

  这时你的谷歌浏览器中就安装完成了我们的第一个工具。如下图所示。一个类似游泳圈的红白相间的小圆圈的标志就是。

  

  Instant-Data-Scraper实际上是一款网页内容抓取工具。

  有了他我们就可以把我们想要得到的关键词数据抓取出来。

  下面我们需要思考一下,我们去哪里抓取数据呢?

  其实有一个很好的平台,我们很多同行都在那里展示产品,基本做外贸的也都知道,对,就是阿里巴巴国际站。

  

  我们就以今年比较火的一款产品来举例讲解吧。

  -无纺布

  即使我们不了解无纺布,百度翻译一下起码也能搞出一个关键词:nonwoven fabric.

  将这个词放入阿里巴巴搜索。你会得到一个庞大的列表,我这里显示有100页。那把这100页中的词抓取出来,就可以得到我们想要的关键词。

  

  接下来,我们点击刚才安装的instant-data-scraper扩展程序图标。

  

  点击try another table。

  

  将红色选择框,定位在阿里巴巴的产品搜索结果区域,如下图。

  

  

  然后点击:locate “next” button按钮。

  

  然后,在阿里搜索结果页中右键单击:翻页按钮即可。

  

  通过这两部,一是确定抓取区域,二是确定翻页位置。

  接下来instant-data-scraper,就可以工作了。

  点击,操作界面中的:start scrawling

  

  这时工具就开始抓取数据了。

  注意:

  至于抓取多少数据,如果你有耐心可以将这100页阿里巴巴搜索结果全部抓取完毕,也可以抓取几十页,也差不多了。时间原因我只抓取了其中的30页。

  抓取完毕后,点击操作界面的:CSV或XLSX下载你想要格式的抓取结果。(我选的CSV)

  

  将文件下载并保存至相应的磁盘位置。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线