excel抓取网页动态数据(PowerBIDesktopDesktop主题模板下载的耐心解析)
优采云 发布时间: 2022-02-18 05:04excel抓取网页动态数据(PowerBIDesktopDesktop主题模板下载的耐心解析)
新界面已在最近更新的 Power BI Desktop 中启用,在选项中勾选重启会打开新界面:
我们来看看新界面是什么样子的:
图标排列与原来相比有很大变化。我觉得最大的变化是视图中的主题可以预览,有点像办公室里的主题。
过去,Power BI Desktop 最受诟病的是这些主题的配色,没有 Tableau 看起来很漂亮。其实Power BI Desktop也提供了主题模板供下载,但是这个网站国内访问有点难,这里我是可以访问的,但是速度慢,看起来不太正常:
如何刷新是这样的。本网站提供了100多个主题模板,点击单个主题打开,勾选即可看到模板文件的下载地址:
在页面上可以看到无法下载,网站被禁用。
我们可以点击检查中的这个链接直接下载JSON到本地。如果看好其中一个题目,可以像这样单独下载。如果要全部下载,一个一个比较麻烦,所以我们使用Power Query查找所有下载链接,然后使用下载工具一次性下载。
第 1 步:网站分析
这个 网站 非常慢,所以请耐心等待。第一步是找到每个主题的地址。我们需要逐页搜索,每页12页,一共120页,如果最后一页也是12页。
打开这个页面后,可以直接用文本解析找到12个连接。
然后我们必须在单独的主题页面上找到下载地址。图片刚刚发了,没有问题。
第 2 步:尝试捕获
试抓主题地址:直接从web,改成从文本中,过滤掉链接地址:
试抓主题文件地址:同样使用文本格式过滤掉文件地址:
很容易找到。
第三步:定义抓取功能
主题地址抓取功能:参数为页码
文件地址抓取功能:参数为主题url
第 4 步:抓住
话题地址抓取:这一步很顺利,展开得到想要的话题地址列表
文件地址爬取:也爬出来了,但是有8个错误
有些错的地方单独检查,有些没有文件地址,我们就忽略了。一共113行正确的文件地址是108行,我们可以抓取108个主题。
让我们将此表复制并粘贴到 Excel 中:
打开迅雷并新建一个下载任务:将这些地址粘贴到迅雷中:
每个文件都不大,一会儿就下载下来:
如何使用这些主题,让我们回到 Power BI Desktop:
浏览主题,然后选择文件,您就完成了
这是刚刚导入的主题:
Power BI Desktop 的主题每次都要重新添加。不能像内置主题一样随时使用,有点不方便。