关注我,教你数据分析实战干货!
如下图所示是一个商品销售数据集,前三行:
需求1:每种商品的销售总额及占比
需求2:销售额前3商品的月趋势
需求3:预测销售额前3商品下半年月趋势
整体思路是:数据清洗→数据分析→数据建模
一、数据清洗
根据需求,需要保留购药时间、商品名称、实收金额即可,但明显缺少时间字段月,利用月份=month(购物时间)函数增加月份数据,然后处理数据集中的缺失值及异常值。
1)空值及异常值处理
空值处理:开始→查找和选择→定位条件→空值,空值较少,可以直接删除所在行,较多可根据实际情况用平均,众数等进行填充,此处暂不展开,以后补充;
异常值处理(使用筛选功能):
i.2018年的2月份只有28天,此处明显为异常值,直接删除
ii.实收金额存在负值明显不符合情况,可结合业务实际情况考虑是否为人工输入有误,此处直接修改为正整数,函数=abs(),增加新列
2)日期字段处理
将日期进行分列
然后利用月份=month(购物时间)函数增加月份数据列
二、数据分析
需求1:每种商品的销售总额及占比
有两种方法,第一种是直接使用透视表,第二种使用公式sumif,第一种更高效,第二种各位可以自行学习(重复值筛选出商品所以种类,用公式匹配求和即可),透视表如下设置
最终结果,进行降序排序及对占比数据优化
需求2:销售额前3商品的月趋势
插入→数据透视图
可在商品名称筛选栏查看各商品的趋势,当然也可以加上周的维度,在数据清洗阶段增加周字段=week(购药时间)即可,是不是很简答呢
三、数据建模
需求3:预测销售额前3商品下半年月趋势
此处的数据是随着时间变化而变化,所以优先选择时间序列算法进行建模,而不是线性回归,多项式回归等等,这里使用的是excel自带的预测工作表和时间序列-移动平均算法。
1)预测工作表法:数据→预测工作表,主要将日期和值数据范围设置好
结果如图:
2)时间序列-移动平均算法
数据→数据分析→移动平均
间隔可进行测试,可根据实际情况取误差减小的间隔值,取2时误差较大,所以取3
可知该方法误差较小
最终预测结果如下:
可知下一个月份的值为前3个月的平均值
这就是本文分享的职场必备excel技能实战(一),主要涉及了excel常用函数,透视表以及excel自带的数据分析包。
之后的文章将涉及更多的数据分析运营干货,包括数据分析方法,互联网,电子商务,广告投放等领域数据分析,工具使用不限于excel、sql、spss、python,记得关注我,教你职场必备数据技能!