excel抓取多页网页数据(【每日一题】:大海,上次你教我《》)

优采云 发布时间: 2022-04-02 13:14

  excel抓取多页网页数据(【每日一题】:大海,上次你教我《》)

  小琴:大海,上次你教我“”的内容,我已经练习过了,这一次,继续教我多爬几页。

  大海:嗯,其实爬几个页面的方法和爬一个是一样的,但是分别爬完每个页面之后,我们需要整合数据。

  小琴:鹅……

  大海:首先,我们还是按页爬取数据。比如我们要爬取1、5、10等三页数据,然后整合在一起。更多页面的工作方式完全相同,您可以自己练习。

  第 1 步:查看 网站 第 1、5、10 页上的链接

  Step-2:【新查询】-【来自其他来源】-【来自网站】

  Step-3:填写网址(网址)-【确定】进入PQ操作界面

  Step-4:选择股票信息所在的表——【编辑】

  Step-5:将第1页的查询命名为“page 1”(根据自己的喜好),方便后续区分

  Step-6: 加载数据 [关闭并上传] - [关闭并上传到...]

  ——因为我们不需要直接显示这个单独页面的数据,所以【只创建一个连接】可以

  重复Step-2到Step6,分别应用第5页和第10页的URL创建新的查询,获取对应页面的数据。最后在Excel中创建了3个查询,如下图所示:

  Step-7:整合数据【新建查询】-【合并查询】-【追加】

  Step-8: 选择要合并的表

  Step-9:设置数据隐私信息

  Step-10:修改查询名称为“Integration 1-5-10”(可以随意命名)

  Step-11:过滤去除数据时间线

  步骤 11:删除多余的列

  步骤 12:上传数据

  因为需要在Excel中显示整个数据,所以只需点击【关闭并上传】按钮,最终结果如下图所示:

  小琴:太好了。中间虽然做了很多步骤,但也接触到了一些新知识:

  大海:嗯,总结的很好。

  小琴:什么时候教我们爬取所有页面?

  大海:这个有点难。它涉及自定义功能,这些功能是高级内容。我会一一为大家讲解PQ的基础知识。练了之后,我们一起练。

  小琴:嗯。不要着急,不要等待!你说得真好!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线