excelvba抓取网页数据(22期Python读书笔记,先聊聊为什么要坚持对Python的学习~)
优采云 发布时间: 2022-03-06 07:16excelvba抓取网页数据(22期Python读书笔记,先聊聊为什么要坚持对Python的学习~)
不知不觉中,我坚持更新了 22 条 Python 阅读笔记。说说为什么要坚持学习Python吧~
作为一个勤奋做Excel知识分享的人,为什么突然分享Python呢?
一、说说Excel的缺点
1、大数据处理能力不足
Excel可以处理几千行、几万行甚至几十万行,但处理几百万行数据总是那么无能为力。能够打开海量数据就很好了,不说怎么处理分析了~
2、抓取网页内容的能力不足
Excel 的另一个缺点是无法抓取网页。之前我也用VBA实现了一些朋友的网页内容爬取需求。可能是我能力有限,没有充分发挥VBA的威力。太好了,很想使用 Python 来获得更多解决方案。
二、谈谈你的个人学习方向
以上缺点已经指明了小编学习、数据处理和网页抓取的方向。
上周四,帮朋友用pandas实现了按某列拆分成不同文件的需求。如果你知道“阿凯的Excel”插件,你就知道我写的插件可以实现这个功能。但是当这个插件面对百万行数据时,我只能说No~
一开始我跟那个朋友说用Python来实现,对方拒绝了,然后我以QQ远程桌面的形式给他展示了用Python处理的速度。怎么形容速度?也就是我执行代码的时候直接生成文件,不用等待时间,然后对方按照我分享的笔记安装Python安装包!
至于网络爬虫,无非是我自己的个人爱好,加上别人的需求~我也想把个人方向改成网站内容抓取-数据自动分析-辅助决策的方向。所以第一个数据源一定要自己解决,只能一点一点的学习~