excel自动抓取网页数据(北京PM2.5各监测站点实时数据详解(图))
优采云 发布时间: 2021-12-23 02:04excel自动抓取网页数据(北京PM2.5各监测站点实时数据详解(图))
一、废话,给个栗子
捕捉北京PM2.5个监测站的实时数据。网址:
只需20秒即可完成数据采集。
注:手机屏幕有限,无法显示详情。在电脑上打开看高清大图。
二、 获取过程
抓取网站表数据分为以下5个步骤:
1、打开想要的截图网站,复制URL。
2、打开Excel,然后单击“数据”选项卡->“来自网站”按钮。
3、 在弹出的“From Web”窗口中,粘贴复制的URL,点击右下角的“OK”。
4、 在弹出的“导航器”窗口中,选择要抓取的表格(通常是同时显示几张表格,可以反复尝试选取你想要的一张),点击“加载”在右下角。
5、 从此,表数据就被抓到了。
三、自动刷新
如果网站的数据会不时更新,而你希望表格打开,它会是最新的内容并且可以定期刷新,你可以做如下设置:
1、 依次点击“数据”选项卡->“全部刷新”按钮下的小箭头->“连接属性”按钮。
2、 在弹出的“查询属性”窗口中,选择“允许后台刷新”,选择并设置“刷新频率”,选择“打开文件时刷新数据”。
3、 自此,自动刷新功能设置完成。以后每次打开文档,都是最新版本。此外,您还可以单击“全部刷新”按钮进行实时刷新。
四、总结
1、 应用场景:
网站 收录表格元素的,比如下面这两个,试试看。例如:
1)新浪彩票双色球数据:
2)国家统计局全国固定资产投资数据:
2、使用限制:
Excel爬取网站数据并非适用于所有网站,被爬取的网页必须收录表格元素,如果没有表格元素,则无法爬取。此类网站的数量约占所有网站的10%。