1. 数据分析的完整步骤
  • 提出问题
  • 理解数据
  • 数据清洗

数据重复【删除重复项】

数据抽取【left,right,mid】

数据计算【average、sum、max、min、date、if、or、countif】

  • 构建模型

分组汇总【数据透视表】

描述统计分析【分析工具库】

多表关联查询【vlookup】

  • 数据可视化
  1. 提出问题
  • 处理数据时注意保留原数据不被更改(在副本上进行修改)单元格格式默认为“常规”,表示Excel会自动根据文本的类型选择对应的格式
  • 小技巧:如何快速判断文本为数字类型还是字符串类型?
  • 字符串类型:左对齐
  • 数字类型:右对齐
  1. 理解数据
  • 第二关的内容

通过设置自动换行,和将列宽统一设置成15,可以使数字更加直观

excel中的数据类型大概可以分成上表中的三种,其中字符串类型和数值类型的区别如下

  1. 数据清洗
  • 清洗的步骤
  • 选择子集
  • 列名重命名(改成自己熟悉的名字)
  • 删除重复值
  • 缺失值处理
  • 一致性处理
  • 数据排序异常值处理
  • 选择子集(列隐藏功能)
  • 列隐藏功能:右键——隐藏,可以隐藏数列,如何恢复显示?选中整个表格——“开始”选项卡——“格式“——”隐藏与取消隐藏“——取消隐藏行或列
  • 列名重命名
  • 删除重复值
  • ”数据“选项卡——删除重复项功能——”取消全选”——选择所需删除重复值的字段——点击确定
  • 练习:删除重复值
  • 缺失值处理
  • 通过比较不同列数值的数量可以发现哪些列有缺失值
  • 处理缺失值的四种方法
  • 找到该数值后人工补全
  • 删除该缺失值对应的行数据
  • 采用定位条件定位之后,在其中一个被定位到的单元格点击右键,选“删除”,然后选“整行”即可
  • 用平均值代替该缺失值
  • 用统计模型计算出来的值来代替缺失值
  • 如何快速定位缺失值?选中对应列——“开始”选项卡——查找和选择——“定位条件”——空值——确定
  • 如何快速补全空白单元格?在其中一个里输入对应数值后,同时点击Ctrl+enter键

小技巧:在选择某列的时候不要点击列名的字母来选取,可以通过左上角的A1:A3055等进行,否则批量补全的时候会补多

  • 练习:如何统计缺失了多少条数据?如何定位到所有缺失值?如何用人工一次性补全所有缺失值?
  • 一致性处理
  • 如果某个字段中出现不符合一致性标准(如一个单元格存在多个数据)的列,我们需要对其进行处理对数据进行分列处理
  • 由于对其进行分列会覆盖右侧一列的数值,因此需将其移动到最右侧
  • 选择“数据”选项卡——分列——选择“分隔符号”,设置分隔符号——完成
    • 练习拆分前,如何复制列?如何进行分列?
    • 小技巧:函数快速应用将鼠标放在单元格右下角,出现十字架形状之后,双击鼠标左键,可快速将函数应用到整列数据中
    • 常用函数Find函数:查找一个字符串另一个字符串中出现的起始位置
    • find函数用来找出目标字符串在单元格中是排在第几位的
      • 格式:Find(要查找的字符串,字符串所在单元格位置)
      • 截取字符串中的内容Left、Right、Mid函数
      • Left/Right(字符串所在单元格位置,从左/右开始到XX位置进行截取)
      • Mid函数(字符串所在单元格的位置,开始位置截取长度
      • 练习:如何用find函数找到薪水范围中的分隔符位置?

=find(“-”,单元格位置)

        • 如何使用left函数截取最低薪水?
        • 如何用mid函数截取最高薪水?
    • 筛选功能功能:按条件查找数据“数据”选项卡——筛选——拉到最下面,可以看到不正常的数值(#Value),选中可以把不正常的数值筛选出来
    • 查找与替换功能可将大小写不一致的字符串改成一致的
    • 练习:掌握如何平均值函数的2种方法?如何计算平均薪水?如何将函数应用到一整列?(双击右下角的十字符号)
      • 如何处理字符串形式的数字?函数得来的数字并不能直接转化为可运算的数值需要选择性粘贴为一列属性为“值”的字段。然后使用“分列”功能,选用分隔符号功能,将其转化为可运算的数值。
  • 选择数据格式为“常规”,回将数值转化为数字。数据排序“开始“选项卡——排序和筛选——升序或降序——扩展选定区域(实现其他字段数值同步调序)异常值处理

打开方式:开发工具——Excel加载项——分析工具库——顶部菜单中的”工具“——数据分析——描述统计

    • 数据透视表的原理数据处理模式:数据分组——应用函数——组合结果数据分组

对数据按相同属性进行分组

        • 应用函数

对分组后的数据进行统计处理

        • 组合结果

重新对结果进行分析

      • 筛选思路已经会用到的函数
  1. 构建模型
  • 在数据透视表的基础上构建
  • 数据透视表建立之后,可以选择相应的字段选择排序方式,
  • 分析工具库的安装:文件——选项——加载项——excel加载项——转到——分析工具库——确定
  • 分析工具的使用
  1. vlookup相关知识
  • vlookup(找什么,在哪找,第几列,是准确找还是近似找)0(False)是精确匹配,1(TRUE)是模糊匹配,;精确查找(0)得到的是第一个值模糊查找(1)找到的是最后一个值跨表索引直接打开两个表进行操作

当索引值有多个相同值时,需要添加辅助列,来将相同索引的值找出来

如何使用vlookup函数来对数据进行分组?

用vlookup函数来对数据进行分组时,需要使用模糊查找,因为查找的是一个范围

注意:vlookup 函数精确匹配时,如果找不到,则返回错误值 #N/A。而大致匹配时函数 VLOOKUP 将查找近似匹配值,也就是说,如果找不到精确匹配值,则返回小于 lookup_value 的最大数值

excel中的三种引用方式:

相对引用:A1

绝对引用:$A$1 (引用时选中引用区域按F4可以快速切换为绝对引用)

混合引用:$A1 A$1

相对引用和绝对引用之间的转换:

引用单元格之后,单击F4键,可以转换为绝对引用,依次点击可以转换为混合引用的两种形式,最后可以换回相对引用。

日期数据如何处理?

1.选中该列数据

2。数据——分列功能

第一步,第二步默认即可

第三步选择列数据格式为“日期”,并且选择“YMD”(年月日)

前面的步骤可以将数据全部转化为日期格式

为了使数据显示的方式更加统一,选中该列,鼠标右键——设置单元格格式,选择年月日的格式即可

小技巧:数据透视表如何设置按周汇总数据?

即可获得以星期一~星期日的按周汇总的数据

#职场加油站#