咔片PPT · AI自动生成演示文稿,模板丰富、排版精美 讯飞智文 · 一键生成PPT和Word,高效应对学习与办公

关注我,教你数据分析实战干货


如下图所示是一个商品销售数据集,前三行:

需求1:每种商品的销售总额及占比

需求2:销售额前3商品的月趋势

需求3:预测销售额前3商品下半年月趋势

整体思路是:数据清洗→数据分析→数据建模

一、数据清洗

根据需求,需要保留购药时间、商品名称、实收金额即可,但明显缺少时间字段月,利用月份=month(购物时间)函数增加月份数据,然后处理数据集中的缺失值及异常值。

1)空值及异常值处理

空值处理:开始→查找和选择→定位条件→空值,空值较少,可以直接删除所在行,较多可根据实际情况用平均,众数等进行填充,此处暂不展开,以后补充;

异常值处理(使用筛选功能):

i.2018年的2月份只有28天,此处明显为异常值,直接删除

ii.实收金额存在负值明显不符合情况,可结合业务实际情况考虑是否为人工输入有误,此处直接修改为正整数,函数=abs(),增加新列

2)日期字段处理

将日期进行分列

然后利用月份=month(购物时间)函数增加月份数据列

二、数据分析

需求1:每种商品的销售总额及占比

有两种方法,第一种是直接使用透视表第二种使用公式sumif,第一种更高效,第二种各位可以自行学习(重复值筛选出商品所以种类,用公式匹配求和即可),透视表如下设置

最终结果,进行降序排序及对占比数据优化

需求2:销售额前3商品的月趋势

插入→数据透视图


可在商品名称筛选栏查看各商品的趋势,当然也可以加上周的维度,在数据清洗阶段增加周字段=week(购药时间)即可,是不是很简答呢

三、数据建模

需求3:预测销售额前3商品下半年月趋势

此处的数据是随着时间变化而变化,所以优先选择时间序列算法进行建模,而不是线性回归,多项式回归等等,这里使用的是excel自带的预测工作表时间序列-移动平均算法

1)预测工作表法数据→预测工作表,主要将日期和值数据范围设置好

结果如图:

2)时间序列-移动平均算法

数据→数据分析→移动平均

间隔可进行测试,可根据实际情况取误差减小的间隔值,取2时误差较大,所以取3


可知该方法误差较小

最终预测结果如下:

可知下一个月份的值为前3个月的平均值

这就是本文分享的职场必备excel技能实战(一),主要涉及了excel常用函数透视表以及excel自带的数据分析包

之后的文章将涉及更多的数据分析运营干货,包括数据分析方法,互联网,电子商务,广告投放等领域数据分析,工具使用不限于excel、sql、spss、python,记得关注我,教你职场必备数据技能