excel抓取网页数据(如何使用ExcelAPI网络函数库抓取JSON格式的网页数据? )

优采云 发布时间: 2021-11-20 03:11

  excel抓取网页数据(如何使用ExcelAPI网络函数库抓取JSON格式的网页数据?

)

  Excel 2013及以后版本提供了WEBSERVICE和FILTERXML函数,可以用于网页数据的抓取,但是只能抓取XML格式的数据。而现在网站的很多网页或者接口都返回HTML或者JSON数据,那么如何准确的抓取这些数据呢?今天以豆瓣图书基本资料为例,给大家介绍一下如何使用Excel API网络函数库抓取JSON格式的网页数据。

  第一步,找到豆瓣网的基本信息页面

  豆瓣图书信息网站是9787111529385,网站最后一串数字是图书的ISBN号。

  在火狐浏览器中,这个URL会返回如下信息,是标准的JSON格式,蓝色字体为属性名称,红色字体对应属性值。

  

  第二步安装ExcelAPI网络函数库

  访问ExcelAPI网络函数库官网,根据帮助页面安装函数库。

  第三步,使用函数抓取JSON数据。

  首先,使用函数 GetJsonSource(url,"UTF-8") 返回 JSON 原创数据。

  

  然后,使用函数 GetJsonByPropertyName(json_source,property_name) 返回书籍的基本信息。使用GetJsonSource()函数一次性抓取所有数据,然后按需抓取。这样做的目的是提高爬行速度。毕竟,访问网页需要时间。

  

  完整的操作如下:

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线