网页表格抓取(Excel抓取并查询网络数据可以使用“获取和转换”+“查找引用函数”的功能组合来实现)

优采云 发布时间: 2022-03-05 18:17

  网页表格抓取(Excel抓取并查询网络数据可以使用“获取和转换”+“查找引用函数”的功能组合来实现)

  Excel抓取和查询网络数据可以通过“获取和转换”+“查找参考功能”的功能组合来实现。

  

  示例:下图是百度百科“奥运”网页中的表格。我们以此为例,将表格抓取到Excel中,我们可以通过输入会话号来查询对应的主办城市。

  

  Step1:使用“获取和转换”功能将网络数据捕获到Excel中

  单击数据选项卡、新查询、来自其他来源、来自 Web。

  

  弹出如下窗口,手动将百度百科“奥运”的网址复制粘贴到网址栏,点击确定。

  

  Excel 连接到网页需要一定的时间。稍等片刻,会弹出如下窗口。左侧列表中的每个表代表网页中的一个表。一一点击预览后,发现Table3就是我们需要的数据。

  

  单击下方“加载”旁边的下拉箭头,然后选择“加载到”。

  

  在弹出窗口中,选择“选择如何在工作簿中查看此数据”下的“表”,然后单击“加载”。

  

  如图所示,Web 表单中的数据已经被抓取到 Excel 中。

  

  点击“表格工具”、“设计”,将“表格名称”改为Olympic Games。

  

  Step2:使用“查找和引用”功能实现数据查询

  创建一个查询区域,包括“会话数”和“主办城市”,在会话编号中选择一个会话并在下图中输入“第08个会话”,进入主办城市下的vlookup功能,可以得到第08届奥运会的主办城市是巴黎,当届数发生变化时,对应的主办城市也会发生变化。

  公式:=VLOOKUP([会话次数],Olympics[#All],4,0)

  

  注意:如果网页中的数据变化频繁,可以设置链接网页的数据定期刷新:

  ①将鼠标放在导入数据区,切换到【设计】选项卡,点击【刷新】下拉箭头→【链接属性】

  

  ②在弹出的【链接属性】对话框中,设置【刷新频率】,例如设置为10分钟刷新一次。这样每10分钟就会刷新一次数据,保证获取到的数据始终是最新的。

  

  《江津Excel》是头条签约作者,关注我,点击任意三篇文章,如果没有你想要的知识,我就是个流氓!

  谢谢你的邀请!如何快速使用Excel快速抓取网站中的上万条数据?在日常工作中,我们经常会采取复制->粘贴的方式,但这种方式不仅耗时,而且非常*敏*感*词*观。今天就跟着视频一起来看看如何实现吧?

  {!-- PGC_VIDEO:{"thumb_height": 720, "vposter": "", "thumb_width": 1368, "vid": "v020168e0000bq9bcdrd82dvh4ototbg", "vu": "v020168e0000bq9bcdrd82dvh4ototbg", "duration": 1持续时间”:@>4,“thumb_url”:“tos-cn-p-0000/687d784120b04f1b8f53d7b034ea2565”,“thumb_uri”:“tos-cn-p-0000/687d784120b04f1b8f53d7b034ea2565”,“video_size”:{“high”:持续时间” 190.4, “h”: 720, “w”: 1368}, “超”: {“持续时间”: 190.4, “h”: 720, “w”: 1368},“正常”:{“持续时间”:190.4,“h”:720,“w”:1368}}} --}

  希望能帮到你!如需更多应用提示,请查看最近分享的视频,文章。有什么问题可以随时留言!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线