原创文章自动采集(原创文章自动采集,需要的工具:excel统计分析工具)
优采云 发布时间: 2022-03-15 01:01原创文章自动采集(原创文章自动采集,需要的工具:excel统计分析工具)
原创文章自动采集,需要的工具:excel统计分析工具:excelsql一、数据预处理在分析过程中,一般用不到最新的数据。即便是最新的数据,我们也需要对数据进行预处理,不然我们利用excel分析出来的结果会出现错误,甚至是无效,这样做,可以让结果更加规范化。预处理的重要性就不言而喻了,因此,今天我们重点来讲解数据预处理的方法,希望大家掌握好这种思维方式。
1.删除重复值我们先通过选择性粘贴将日期数据完整保留,如下图所示:选择“数据”——“删除重复项”,打开删除重复项对话框,选择列——空值,删除重复项数据即可。2.缺失值处理因为我们是要对缺失值进行处理,我们首先要根据数据进行填充,以此将缺失值补全,使数据有效。比如下图所示,数据有141个,我们不直接填充,而是采用if函数,判断数据是否有缺失值,如果有缺失值,则将缺失值进行删除,并赋予新值。
选择“数据”——“查找和选择”,打开查找和选择功能对话框,点击“定位条件”——“空值”,即可显示所有缺失值,我们不需要这141个数据,所以选择“不予显示”,点击下一步即可。3.数据类型转换现在就可以直接利用excel的数据类型转换功能进行数据的转换。转换中,要注意转换后的数据一定要保留原数据格式,否则excel数据不会给我们显示。
格式大多是通过公式转换出来的,有些公式和我们实际需要转换的数据格式一样,我们应该重点注意这方面,以防出错。这里需要注意的是要确保在转换过程中,数据的顺序不会发生变化,否则就不能进行格式转换。我们通过在工作表中调整一下勾选全选,点击转换功能右下角的“确定”即可。4.数据排序因为我们要排序,那么就要对排序后的数据重新进行操作。
排序会方便我们查找、整理、计算,但是会导致一些数据结果难以还原,下面我们看看操作过程,具体操作步骤如下:选择“数据”——“数据透视表”,打开数据透视表对话框,在格式选项卡中,有上、下排序功能,我们将表格下面的三个数据进行调整,如下图所示:现在的图表应该是这样的。我们通过上面几种格式的调整将数据进行大的调整。
5.排序变量选择功能这个在实际工作中应用非常的多,下面我们通过一个案例进行说明。比如我们查看去年的销售和客户分布,我们想统计哪些客户经营比较成功,我们需要列出客户的销售。下面我们打开一个表格,将销售量进行排序,如下图所示:选择“数据”——“排序变量”(图表1):我们可以在右侧看到“销售量”,对销售量进行排序,单击排序结果即可查看销售量。6.复制,合并同类项我们知道将。