网页表格抓取(如何使用ExcelAPI网络函数库抓取JSON格式的网页数据?)

优采云 发布时间: 2022-01-13 12:09

  网页表格抓取(如何使用ExcelAPI网络函数库抓取JSON格式的网页数据?)

  Excel 2013及以后版本提供WEBSERVICE和FILTERXML函数,可用于网页数据采集,但只能采集XML格式的数据。现在很多网站网页或者界面返回HTML或者JSON数据,那么如何准确的抓取这些数据呢?今天笔者就以豆瓣图书的基本信息为例,介绍如何使用Excel API网络函数库抓取JSON格式的网页数据。

  1 第一步是在豆瓣上查找书籍的基本信息。豆瓣网图书信息的网址是n/:9787111529385,网址最后一串数字是图书的IN号。在火狐浏览器下,这个URL会返回如下信息,都是标准的JSON格式。蓝色字体为属性名称,红色字体为对应的属性值。

  

  2第二步,安装ExcelAPI网络函数库。访问ExcelAPI网络函数库官网,根据帮助页面安装函数库。或者参考百度经验《Excel生成条码》

  

  3 第三步,使用函数抓取JSON数据。首先,使用函数 GetJs o e(url, "UTF-8") 返回 JSON 原创数据。

  4 然后,使用GetJsonByPropertyName(json_so e, property_name)函数返回图书的基本信息。使用GetJs o e() 函数可以一次抓取所有数据,然后按需抓取。这样做的目的是提高抓取速度。毕竟,访问网页需要时间。

  

  必须安装 Excel API 网络函数库

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线