关注后回复“资料”,即可免费获取Excel相关学习和实战资料。如果你也对数据分析感兴趣,并且想在这方面有所发展,无论是方法还是技术,例如Excel、VBA、SQL、Python,特别是Excel相关,欢迎与我交流。如果有这方面的问题或者困惑,也欢迎与我探讨。


对于任何一个数据统计和分析者来说,数据的来源有很多,例如公司的数据库(包括使用SQL等语句查询的数据或者公司业务数据平台的数据等)、同事提供的数据、网站爬取的数据、从外部购买的数据等等。


对于任何数据源的准确性,都要保持一定的怀疑态度,因为数据源的准确性是后续一切工作的基石,包括后续的数据处理、模型构建、关键决策都是建立在最初的数据源之上的。如果说数据源本身有问题,那么后续的一切都是有待商榷的,或者都是错误的。


数据源出问题的原因有很多,针对不同渠道的数据,出问题的原因也不尽相同,例如零售新旧业务系统升级的时候,系统与系统之间没有衔接好,对于终端实际的使用人员没有进行及时和全面的培训,都有可能会造成数据的重复和缺失。同事在汇总数据时,将同一份数据进行了重复汇总,或者在复制粘贴的时候行列错位,例如将实际成交价格和原始吊牌价格颠倒。


所以在数据处理之前,要对收到的数据做核查,而核查就要确定核查优先级和核查标准。数据可能有很多,核查的优先级就是优先对核心指标进行核查,例如零售中的单日流水、折扣、成交笔数、客单价等。再有就是找到核查标准,能够去检验当前的数据准确性,这个核查标准主要就是历史数据和业务认知。历史数据,例如同期的数据、上周或者上月的数据,也可以直接查看同比和环比的结果来观察数据波动。业务认知,在不看数据之前已经知晓已有的业务决策,例如同样是节假日,两年的活动不同,一年是打折促销,一年是赠送礼品,或者同期过季产品很多,做了大量过季产品的处理,导致核心指标变化较大。


将已有的业务认知和历史数据相结合,才能对数据做出更精准的判断。再有就是一些细节上的观察,例如文字描述和图片数据不符。同样,我们在为他人提供数据之前,也要为提供的数据把好关,因为那不止会影响后续的一些列工作,还有我们自身的价值体现以及他人对我们的信任感。



推荐阅读:


VBA 代码繁杂,如何一招化繁为简

同事又发来了图片数据,如何提取汇总?