网页表格抓取(如何不使用Python去爬取网页数据?论Excel的万用方法)

优采云 发布时间: 2021-11-09 00:12

  网页表格抓取(如何不使用Python去爬取网页数据?论Excel的万用方法)

  现在很多朋友都知道可以用Python来爬取数据,但是如果你想从头开始学习Python爬虫,学Python还是需要一些时间的。但是,如果是抓取一些简单的网页表单数据,则没有必要使用Python。

  今天教大家不使用Python爬取网页数据。

  

  Excel 的通用方法之一是 Excel。Excel可以帮你实现简单网页抓取数据的功能。

  先找到大家想爬的数据表。

  比如今天就让我们爬取中国天气网站上的广东天气预报吧~

  

  然后我们复制网站的链接,打开Excel,在菜单栏找到网站的数据。

  

  然后将您刚刚复制的链接粘贴到新打开的:New Web Query 中。

  

  点击Go打开网站,在这里预览中找到要导入的数据表,然后勾选左上角。

  

  选择后,点击右下角的导入,将选中的表格数据导入Excel。

  导入数据。

  

  接下来就可以看到你想要的数据在Excel表格中一一呈现了~

  

  有些朋友有疑问。这样导出的数据都是固定的。如果网页数据更新了,不需要重新导入吗?

  其实不是,Excel也自带数据刷新功能。我们还是在菜单栏里找到:data-link properties 下的refresh all。

  

  在链接属性中选择刷新条件、刷新频率、时间等,然后Excel会根据你设置的刷新属性自动更新数据~

  

  上图是自动抓取刷新数据的Excel表格~~

  当然,使用Excel表格爬取数据有利有弊。优点是使用Excel自带的功能来捕获和更新数据简单方便,不涉及编程等复杂操作。缺点是Excel网页数据抓取只能抓取表格数据,其他数据很难获取。

  

  因此,如果你想获得更多元网页数据,不妨学习Python,这是目前爬虫类中最容易学习的。

  如果想了解更多实用技巧,可以关注一下,以便下次更新及时通知W=。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线