网页表格抓取(一下excel文件网页数据的过程,实验环境win7+office2013)

优采云 发布时间: 2022-04-12 10:09

  网页表格抓取(一下excel文件网页数据的过程,实验环境win7+office2013)

  当然可以,但是使用起来不是很灵活,也不需要等待语言去抓取数据。现在简单介绍一下excel中抓取数据的过程。实验环境为win7+office2013。主要内容如下:

  1.新建一个用于网页数据抓取的excel文件,双击打开文件,选择“数据”-“来自网络”,如下:

  2.在弹出的子窗口中,输入要爬取的网页数据。这里使用“Import”进行捕获,如下:

  3.导入成功后,抓取网页数据。数据如下,我们需要的数据已经成功抓取到:

  

  4.如果要定时刷新数据,如果要爬取网页数据,可以点击“全部刷新”-“连接属性”自定义刷新频率。默认值为 60 分钟:

  在弹出的“选择属性”窗口中抓取网页数据,设计刷新频率,定时刷新数据:

  至此,我们就完成了使用excel抓取数据的网页数据抓取。总的来说,整个流程还是比较简单的,但是灵活性不是很高,而且如果页面比较复杂,抓取的数据量比较大,后期直接在excel中处理不是很方便,并且主题所有者已经知道python。, 推荐使用python直接抓取,比较灵活。Python提供了很多包和框架,比如requests、bs4、lxml、scrapy等,可以快速抓取数据,方便后期处理(比如pandas、numpy等),学了就可以了尽快开始。网上也有相关资料和教程。希望以上分享的内容对您有所帮助。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线