[文章]超实用:通过Excel进行数据采集

优采云 发布时间: 2020-08-10 15:27

  前言

  IBM*敏*感*词*区总经理胡世忠曾说:数据构成了智慧月球的三大元素——智能化、互联化和物联化,而这三大元素又改变了数据来源、传送方法和借助形式,带来“大数据”这场信息社会的变迁。

  从上可见,时代的改革是始于对数据的借助,对企业而言,数据也同样是其发展、转型的命脉。在工作中,我的高手不止一次地指出,数据是公司的资产,而且举足轻重。我们对待数据,一定要严谨,经得起考验,对自己的数据负责,这是一个数据人的基本要求。

  数据资源

  大数据时代,数据尽管好多,但是也不是随便得来的,需要借助各类渠道和方法获得。不管从那个角度来说,数据可分为内部数据和外部数据。内部数据是企业在日积月累的经营中得来的,我们应当对那些数据挖掘、采集有价值的东西,形成企业的数据资产。内部数据重在后期的处理和剖析上。

  下面先说外部数据的获取方法,以及通过Excel操作来获取外部数据。

  

  外部数据获取方法

  1、专业网站看数据(某一个行业、某一件产品)2、通过收费渠道买数据(第三方数据平台等)3、通过特殊方式引数据(网站爬虫,统计网站等)4、自身积累数据(时间久、跨度长)

  Excel获取外部数据

  作为一个数据分析师以及想更进一步成长为数据科学家,熟练操作基本的办公软件以及SQL查询是很重要的。请看下边通过Excel获取外部数据的步骤。

  第1步:打开“新建web查询”框。新建Excel工作簿,在打开的工作表中单击“数据”选项卡,然后在“获取外部数据”组中单击“自网站”按钮,如下图。

  

  第2步:输入网址并选择要导出的表格数据。在弹出的“新建web查询”对话框中的“地址”文本框中复制粘贴上述网页的网址,然后单击“转到”,找到网站中的表格数据后单击表格左上角的箭头→,图标弄成选中状态的复选框√。如下图。最后单击下方的“导入”按钮。

  

  第3步:选择数据的放置区域。点击导出后,Excel会出现“导入数据”对话框,如下图,选中你想放置的单元格,单击“确定”开始导出。

  

  第4步:美化导出的数据。由于导出的数据多且乱,要调整格式让数据规范,并启用冻结窗棂功能便捷浏览。如下图。

  

  好了,上面就是通过Excel操作来获取网站上的外部数据,很简单吧,但网站中的数据并非都是以表格的方式呈现,现在大部分是以json格式呈现,Excel不是万能的,而且如今好多网站需要付费就能导数据(上面说过数据就是企业的资产)。

  

  小结

  希望通过前面的操作能帮助你们。如果你有哪些好的意见,建议,或者有不同的想法,我都希望你留言和我们进行交流、讨论。

  End.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线