在数据分析工作中,掌握相关的软件工具是一部分,另一个比较大的或者说是比较重要的部分就是数据分析的工作流程,人们对于这部分也是比较好奇的。本篇文章给大家分享我的一段真实的数据分析的日常工作,以便大家能够更好地对数据分析的日常工作有一个大概的了解。
首先先介绍下背景,这份工作的主要内容是信用卡的数字营销(Digital Marketing)。相信大家都有这个经验,在浏览网站的时候,会有广告弹出来,如果弹出的信用卡的广告是你感兴趣的,当点击进入这个广告的时候,页面就会自动跳转到银行的信用卡界面,当你填好了申请信用卡的各种信息,比如姓名,年龄,职业等等信息并且提交后,银行的后台会核实潜在客户所提交的信息然后觉点是否通过客户的申请。这个阶段在英文中叫Application Adjudication。
上面所说的就是一个典型的数字营销的一个过程。一般会有一个数字媒体公司(下面用A公司来代表)承包了一些主要网站中的广告位,当然一些网站也会找这些数字媒体公司合作广告开发。然后我们银行(下面用B公司)的数字市场部门向A公司购买广告位。费用一般是以展现量(impressions)为基准,打个比方1万次展现1加币,当然有的也是根据卖出的信用卡的数量来收费,比如一张信用卡40加币等等。
A公司内部会有一系列的软件平台来记录展现量和点击量等等,谷歌有很多产品来做网站的流量记录的,比如Google Campaign Manager, Google Analytics等等,A公司记录的我们叫Media File。而一但有人点击广告进入B公司页面,B公司的软件平台(通常也都是谷歌的产品)也会记录这些流量走向,我们在工作中叫Floodlight file。
而我的工作就是给数字市场部门做报告,展示给他们有多少展现量,多少个点击,多少个申请,多少张信用卡被卖出的。
这个工作的工作周期是以星期为单位的。周一早上来到办公室,先从A公司的网站上下载上个星期的流量相关的Media File,然后再从我们的流量记录平台上下载Floodlight File。这些文件下载下来都是以CSV的格式保存起来(Excel就可以打开CSV文件)。这个工作通常就有一上午的时间,如果有的时候系统发生些故障,一天也是有可能的,因为A公司下的渠道(Channels)有很多,比如有的是展现在社交媒体上的(像脸书,领英等等),有的是展现在专门的信用卡经销商网站上的,有的是通过搜索引擎搜索的。所以不管是Media还是Floodlight,都不止有一个文件。
工作的第二步就是把这些CSV文件中的数据转移到SAS环境当中,然后根据匹配条件(matching condition)把Media和Floodlight文件合并到一起。这里面就是数据分析中十分重要的一个技术环节了,叫joining tables,这个是在数据分析中肯定要做的事情,有兴趣的可以了解下SQL joining tables,在实际工作中都是用SQL的语句来合并表格。再这个过程中不仅仅是Media和Floodlight的合并,还要去B公司的数据库里取出一些数据,比如B公司的Ajudication数据(Approved,Declined和Pending)。
SAS EG 界面
合并表格后,再通过市场部门的一些要求,产生一些新的变量(variables或者columns),或者做一些计算。一般都是市场业务部门来定义指标(KPI或者Metrics)和提供指标的计算方式,简单点的比如点击率,就是点击数量除以展现量;通过率,就是最终的信用卡卖出数除以申请数;每张信用卡的花费,总的费用除以信用卡的卖出数等等。而我们的工作主要就是通过写程序(主要是SQL语句)来实现业务部门所提出的指标。这些工作通常会占据70%左右的时间和精力。
整合好以上提到的这些数据这些数据(主要就是在SAS中run这些程序),然后再把这些数据展现在Excel上,这个部分就是Reporting的部分了。有的指标用现状图来表示,有的指标用柱状图来表示,有的指标就直接在Excel上展现数据。当然,现在越来越多的公司开始用Tableau或Power BI来做最后的报告。
通常这些事情做完后就一直到礼拜三的下午了。每个礼拜三的下午都会和数字市场部门的人开会来展现和说明这些数字,以及报告上做了哪些改变。市场部门在指标上的要求可以说是经常变得,当指标或指标得计算方式改变,我们相应的在SAS中的程序就要有相应的改变。银行中的这些程序一般都是已经使用了好几年的了,当然随着市场策略的改变,会有一些程序上的改变,而在数字市场营销中,市场策略可以说是经常改变的。所以一般在周四和周五的主要工作就是根据市场策略来改程序(Code)。
有些程序在一个星期内不可能改完的,所以一般会有一个deadline,在这之前会用之前的策略。通常改完Code后还要有一个检测和测试的阶段(QA),等QA过后没有问题了再把改过的Code应用到日常工作中。
上面给大家分享的是我在两三年前的一段真实的工作经历,做了大概有一年半的时间。其实是一段非常有意思的工作经历,因为涉及到的是当下最火的数字营销(Digital Marketing),希望能在彻底忘掉其工作流程前分享出来。当然这份工作不光有以星期为周期的日常工作,还有一些是以月为周期的项目和以季度为周期的项目。希望以上的分享能帮到大家。
图自网络,侵删。