excel抓取多页网页数据(【每日一题】:大海,上次你教我《》)
优采云 发布时间: 2022-04-02 13:14excel抓取多页网页数据(【每日一题】:大海,上次你教我《》)
小琴:大海,上次你教我“”的内容,我已经练习过了,这一次,继续教我多爬几页。
大海:嗯,其实爬几个页面的方法和爬一个是一样的,但是分别爬完每个页面之后,我们需要整合数据。
小琴:鹅……
大海:首先,我们还是按页爬取数据。比如我们要爬取1、5、10等三页数据,然后整合在一起。更多页面的工作方式完全相同,您可以自己练习。
第 1 步:查看 网站 第 1、5、10 页上的链接
Step-2:【新查询】-【来自其他来源】-【来自网站】
Step-3:填写网址(网址)-【确定】进入PQ操作界面
Step-4:选择股票信息所在的表——【编辑】
Step-5:将第1页的查询命名为“page 1”(根据自己的喜好),方便后续区分
Step-6: 加载数据 [关闭并上传] - [关闭并上传到...]
——因为我们不需要直接显示这个单独页面的数据,所以【只创建一个连接】可以
重复Step-2到Step6,分别应用第5页和第10页的URL创建新的查询,获取对应页面的数据。最后在Excel中创建了3个查询,如下图所示:
Step-7:整合数据【新建查询】-【合并查询】-【追加】
Step-8: 选择要合并的表
Step-9:设置数据隐私信息
Step-10:修改查询名称为“Integration 1-5-10”(可以随意命名)
Step-11:过滤去除数据时间线
步骤 11:删除多余的列
步骤 12:上传数据
因为需要在Excel中显示整个数据,所以只需点击【关闭并上传】按钮,最终结果如下图所示:
小琴:太好了。中间虽然做了很多步骤,但也接触到了一些新知识:
大海:嗯,总结的很好。
小琴:什么时候教我们爬取所有页面?
大海:这个有点难。它涉及自定义功能,这些功能是高级内容。我会一一为大家讲解PQ的基础知识。练了之后,我们一起练。
小琴:嗯。不要着急,不要等待!你说得真好!