excel抓取网页动态数据(PowerBIDesktopDesktop主题模板下载的耐心解析)

优采云 发布时间: 2022-02-18 05:04

  excel抓取网页动态数据(PowerBIDesktopDesktop主题模板下载的耐心解析)

  新界面已在最近更新的 Power BI Desktop 中启用,在选项中勾选重启会打开新界面:

  

  我们来看看新界面是什么样子的:

  

  图标排列与原来相比有很大变化。我觉得最大的变化是视图中的主题可以预览,有点像办公室里的主题。

  

  过去,Power BI Desktop 最受诟病的是这些主题的配色,没有 Tableau 看起来很漂亮。其实Power BI Desktop也提供了主题模板供下载,但是这个网站国内访问有点难,这里我是可以访问的,但是速度慢,看起来不太正常:

  

  如何刷新是这样的。本网站提供了100多个主题模板,点击单个主题打开,勾选即可看到模板文件的下载地址:

  

  在页面上可以看到无法下载,网站被禁用。

  我们可以点击检查中的这个链接直接下载JSON到本地。如果看好其中一个题目,可以像这样单独下载。如果要全部下载,一个一个比较麻烦,所以我们使用Power Query查找所有下载链接,然后使用下载工具一次性下载。

  第 1 步:网站分析

  这个 网站 非常慢,所以请耐心等待。第一步是找到每个主题的地址。我们需要逐页搜索,每页12页,一共120页,如果最后一页也是12页。

  

  打开这个页面后,可以直接用文本解析找到12个连接。

  然后我们必须在单独的主题页面上找到下载地址。图片刚刚发了,没有问题。

  第 2 步:尝试捕获

  试抓主题地址:直接从web,改成从文本中,过滤掉链接地址:

  

  试抓主题文件地址:同样使用文本格式过滤掉文件地址:

  

  很容易找到。

  第三步:定义抓取功能

  主题地址抓取功能:参数为页码

  

  文件地址抓取功能:参数为主题url

  

  第 4 步:抓住

  话题地址抓取:这一步很顺利,展开得到想要的话题地址列表

  文件地址爬取:也爬出来了,但是有8个错误

  

  有些错的地方单独检查,有些没有文件地址,我们就忽略了。一共113行正确的文件地址是108行,我们可以抓取108个主题。

  让我们将此表复制并粘贴到 Excel 中:

  

  打开迅雷并新建一个下载任务:将这些地址粘贴到迅雷中:

  

  每个文件都不大,一会儿就下载下来:

  

  如何使用这些主题,让我们回到 Power BI Desktop:

  浏览主题,然后选择文件,您就完成了

  

  这是刚刚导入的主题:

  

  Power BI Desktop 的主题每次都要重新添加。不能像内置主题一样随时使用,有点不方便。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线