网页表格抓取(如何不使用Python去爬取网页数据?论Excel的万用方法)
优采云 发布时间: 2021-11-09 00:12网页表格抓取(如何不使用Python去爬取网页数据?论Excel的万用方法)
现在很多朋友都知道可以用Python来爬取数据,但是如果你想从头开始学习Python爬虫,学Python还是需要一些时间的。但是,如果是抓取一些简单的网页表单数据,则没有必要使用Python。
今天教大家不使用Python爬取网页数据。
Excel 的通用方法之一是 Excel。Excel可以帮你实现简单网页抓取数据的功能。
先找到大家想爬的数据表。
比如今天就让我们爬取中国天气网站上的广东天气预报吧~
然后我们复制网站的链接,打开Excel,在菜单栏找到网站的数据。
然后将您刚刚复制的链接粘贴到新打开的:New Web Query 中。
点击Go打开网站,在这里预览中找到要导入的数据表,然后勾选左上角。
选择后,点击右下角的导入,将选中的表格数据导入Excel。
导入数据。
接下来就可以看到你想要的数据在Excel表格中一一呈现了~
有些朋友有疑问。这样导出的数据都是固定的。如果网页数据更新了,不需要重新导入吗?
其实不是,Excel也自带数据刷新功能。我们还是在菜单栏里找到:data-link properties 下的refresh all。
在链接属性中选择刷新条件、刷新频率、时间等,然后Excel会根据你设置的刷新属性自动更新数据~
上图是自动抓取刷新数据的Excel表格~~
当然,使用Excel表格爬取数据有利有弊。优点是使用Excel自带的功能来捕获和更新数据简单方便,不涉及编程等复杂操作。缺点是Excel网页数据抓取只能抓取表格数据,其他数据很难获取。
因此,如果你想获得更多元网页数据,不妨学习Python,这是目前爬虫类中最容易学习的。
如果想了解更多实用技巧,可以关注一下,以便下次更新及时通知W=。