咔片PPT · AI自动生成演示文稿,模板丰富、排版精美 讯飞智文 · 一键生成PPT和Word,高效应对学习与办公

一份条理清楚,简洁明快的数据报告的背后,都有一份干净整洁数据源作为支持。如何定义一份数据源为好数据源?应该有以下几个标准:

  • 没有合并单元格:Excel高手们最痛恨的就是合并单元格。有没有因为学会了合并单元格而觉得Excel非常神奇的同学,做“表格”可以使用合并单元格,但是做数据源表,合并单元格是第一大忌;
  • 没有不可见字符:很多系统导出表会额外添加空格补齐字符串长度;手工输入数据,有时也会多一个或几个单元格的情况;或者是其他数据源导入到Excel时,会有些莫名其妙的不可见字符。这些不可见字符,会导致看起来相同的两个字符串,在查询时就是出错查不到,或者透视表时会显示成两个项目,导致合计数据出错;
  • 数据格式一致:最常见的格式不一致情况,文本型数值,千奇百怪的非标准日期(例如:小数点分割的),由于格式的不一致,会导致计算结果出错。
  • 分组一致:举个例子,性别,如果不做严格规定,大家会随意输入,勤快的会输入男性、女性,或者男、女,还有用英文简写的M、F,这就叫做分组不一致,都没错,错在没有统一。这样的数据源透视时,性别会出现六个,结果肯定是有问题的;

实际情况是,我们能够收集到的数据,往往不会完全符合这个标准,或多或少都会有些问题,当我们遇到这些问题时,该如何去处理:

  • 合并单元格的处理:其实也挺简单,打散合并,定位空白格,填充。
  • 不可见字符处理:情况就比较复杂,方法也多种多样,有分列法,函数法,PQ法,记事本等等,根据难度不同来选择,可以简单先了解。
  • 数据格式:分列的功能还是很多的,其中之一就是用来统一数据格式,当然还有很多其他的统一格式的方法,比如,*1法,--法等等。
  • 分组:最常用的就是LOOKUP和VLOOKUP函数,可以建立辅助表,使用函数统一分组。

以上可以认为是对数据做了4S整理(整理、整顿、清扫、清洁),得到了相对规整的数据源,但还是会有问题,维度上的问题,应该归纳为一个维度的数据,却分成了多个维度(多列),这时候我们需要做降维处理:

  • Power Query降维:强烈推荐使用PQ处理,操作简单方便。
  • 操作法:ALT+D+P
  • VBA法:不建议使用,也写过代码处理过,但是有更方便的方法,就不再用这个方法了。

最后要说的是分组,这里的分组,与上面的统一分组讲不是一回事,上面是已经有了分组,分组的名称不统一,要统一名称。这里讲的分组是创造分组,对于已有的维度进行创造分组:

  • 数值分组:因为数值范围很大,我们希望分段统计,进行数据分析,这时候,我们就要使用LOOKUP函数,对数值进行分段。
  • 文本分组:同样是城市维度,我们希望按照东北区、华北区进行分组,要用到的函数是VLOOKUP。
  • 日期分组:对于日期维度,天然带有分组,年、月、日,或许你还希望用季度来统计,或者按周统计,需要用到相关的日期函数,TEXT函数,还有INT、MOD等数学函数。

经过上面这些步骤,你就可以开始进行数据透视操作了,数据透视操作,比公式法统计的有点在于,公式法是在固定的框架下统计,而数据透视,是对数据的一种探索统计,通过不同维度的组合,能出现各种可能的结果,可以对数据从各个维度进行充分的分析。