
(本文探讨了数据分析在业务探索上的应用。内容较长,共7000字。)
企业经营面临诸多决策,这些决策从何而来?它们由管理者从经营事实中提取信息,并结合自身经验产生。这一点就要求管理者和决策者需对经营状况有一个客观准确的认识。通过商业分析,可以使我们尽量充分又不失准确地洞察经营状况。从经营数据中提取信息的过程,我把它称为数据探索。
数据探索,在数据技术领域,通常指在数据清洗过程中,对手头数据集进行统计描述分析以试图归纳发现一些信息。在本文,数据探索的内涵更多是从业务角度提出的,它的目的是通过对数据进行各种分析,并不限于描述性统计分析,以发现企业业务中的关键信息。
我将以一个线下零售案例为背景示例一段商业分析之旅。因为零售业的经营模式相对最容易理解,几乎不要求较多的商业经验。与此同时,对零售业务的数据探索,还能让我们一窥商业分析的力量和魅力。我将以一个“自然”的思路轨迹展示整个商业分析过程。零售数据来自某线下连锁便利店企业的一个门店数据。为保证企业原始经营数据不泄露,数据仅包含当年前11周的数据,并且在示例中我会对数据做一些变换处理。此外,本次示例我将仅用Excel完成操作,这意味着企业在初期对商业分析的IT系统投入可以降到最低。
零售的周期
零售业的一个典型特征就是具有明显的周期性。在数据分析领域,更准确的术语是“季节性”,因为它指的是中短期的周期特征。我们一般把以5-10年或更久的呈周期特征的时间序列称为周期性。而像一年之内的周期性,则命名为季节性。零售业产生季节性特征的原因不难理解,比如受消费者获得收入的影响,以及一些商品本身就具有重复性消费的特征。在零售业务中找出季节性特征,对理解零售业务具有关键意义。
大多数传统线下零售企业的数据主要来自POS收银系统。这类收银系统存在已经几十年,功能单一,无法识别消费者。它保留的仅仅是一个消费记录。如果说一套收银系统能够记录下消费者身份信息,就像电商那样,那么分析整体顾客人群的消费周期就有章可循。但若数据集中仅有每笔交易的订单记录,根本无法确认每一笔是由哪个顾客消费产生的,将如何分析寻找季节性规律?答案就来自零售本身固有的周期特征。我将分析动销商品的订单记录,从中找出季节性规律。在做这样的分析之前,我们应该首先对商品做一个初步的分类。这是因为不同的商品动销表现并不相同,如果一股脑把它们混在一起分析,实际上就混杂了多种商品的动销信息,这可能反而让我们看不出隐藏在销售记录中的线索。那么这样的商品类别该如何选择呢?我先从香烟这个品类入手,原因是香烟消费具有典型的周期性特点。通过对数据的整理,我得到一个一段时间内香烟订单量的趋势图。如下方图1所示,纵轴是实际订单量的某种数学变换,它如实反映了订单量趋势变化,但隐藏了真实的订单量信息。
图1 一段时间内7款香烟的订单量趋势由于第1周和第11周数据均不满一周,所以舍弃不用,只保留了从第2周到第10周的数据。从图1中,我们能看出该门店的零售季节性规律吗?似乎有点季节性的倾向,但不是很明显。所以我们对不同香烟订单叠加以做出观察性判断。
我罗列9款香烟的同期累计订单量,如下方图2所示。
图2 前11周9款香烟累计订单量递进图实际上从7款香烟开始,再后面叠加的香烟订单趋势将没有明显变化。这些先后叠加的香烟商品是有选择的。我通过将香烟实际销售单价从高到低排序,分别观察它们的订单量,然后只选择那些订单量明显较大的香烟。如下方图3所示,该图一般也称为价格带分布图。
图3 香烟价格带分布因此,通过简单地对那些有显著销售量的香烟产品进行累计汇总,再结合前面的图1或图2,我们通过观察分析,判断出季节性周期为3周。具体地说,就是2-4周、5-7周、8-10周是该门店香烟零售的3个周期。
线下零售店不只销售香烟,也销售其它品类商品。我们将商品简单划分为香烟和非香烟两个类别,来看一看非香烟品类的销售情况。
图4 非香烟类商品的销售趋势在图4中,我沿用了从香烟商品获得的季节性特征,将非香烟类商品的销售也划分为同样的3个季节性周期。在图4中,我们可以看到在周期1和周期3中,似乎出现了同样的重复性规律。至于周期2的订单量为什么明显高于其它两个周期,是因为这期间是当年春节。所以,目前为止,我们依然可以接受3周为一周期的季节性规律特征。对横轴日期进行压缩,可以看到更为明显的结果,各周期内销售情况接近平稳。如下方图5所示。
图5 非香烟类商品的周期销售趋势对大多数零售企业来说,零售业务的季节性周期为4周左右(1个自然月)是自然的。这与人们的收入季节性周期吻合。只是有时候这个季节性周期规律不一定严格与4周吻合。
我们刻意观察零售的季节性规律是为了什么?其中一个比较关键的考虑,是它可以帮助我们了解零售门店的顾客规模和顾客消费能力。
门店顾客的规模
一个门店的顾客数量是多少?这对门店来说是个重要的问题。传统的零售分析里,关注的到店顾客数实际上是到店客流。在这里我们不是指这个数据,而是指真实的顾客人数。通过上一步分析的季节性周期规律,我们通过订单量估计这个数据。如下方图6所示。
图6 全部商品各周期内订单量分布由于POS收银系统无法确定每笔订单的消费顾客身份,因此我们只能粗略地估计。对店员来说,粗略估计一名顾客多久来门店消费一次不是很困难。只要留意一些顾客的消费频次就可以了。通过一定样本的观察,我们可以假设比如一名顾客平均一周会来消费一次。因此从图6数据,我们可大致倒推出该门店服务的顾客人数约为700-800名顾客。或者通过进一步精细的计算,可以大致判断顾客人数为750-800名。周期的含义是,这些顾客每3周至少来消费一次,因此每个周期内看起来就产生差不多2100-2400笔消费记录。
这个数据有什么用呢?
对于零售从业者来说很熟悉的一项事务,是在一家门店正式开业前,需要做店址考察。考察的重要内容之一,就是评估该店址的潜在市场规模,退一步讲,即该门店覆盖的顾客总人数。这里我们可以用TAM(Total Available Market)来描述它。假设这家门店的TAM顾客人数为3000名,那么该门店占据TAM的市场占有率约为750/3000=25%。并且通过对香烟和非香烟类订单的一系列计算,可知香烟顾客为360名,每名香烟顾客每周期消费60元,换算为自然月为80元/月,或1000元/年。非香烟顾客480名,每周期消费30元,换算为自然月为40元/月,或500元/年。其中有72名顾客既是香烟顾客,又是非香烟顾客。顾客人数的分布示例如下方图7所示。
图7 零售门店顾客分布示意由上,我们也就获知了客户价值。两类客户,只要计算其贡献的利润,就可以直接衡量其顾客价值。这里为隐去该门店的真实利润水平,我们仍沿用销售额来代替顾客价值。从上述数据,我们可以对该门店的经营状态做一个初步的描述。首先香烟类顾客,每名顾客平均每月消费80元,从现实判断,处于一个合理的水平。这类顾客占总市场比例为12%,即360/3000,也处于一个合理的水平。因为收集烟民数据可知,我国烟民约3.5亿,占总人口比例大约为22%。综合考虑地区、公共场合禁烟等因素,12%可以接受为合理水平。但该门店在非香烟类商品上的销售绩效偏低。无论是客户每月平均消费金额40元,还是这类顾客占总市场比例16%(480/3000),都明显偏低。
如果想要提高门店经营收益,我们应该怎么做才好?我们有必要对两类顾客的消费情况做进一步的细分,以了解他们对经营的影响。
细分
由于香烟消费者一旦习惯某款香烟,他轻易不会更换品牌、档次和口味。这给分析带来了一定便利,所以我们利用这一特性,先从香烟这一类商品开始分析。
我们用销售额和订单量这两个维度来划分香烟类商品。如下方图8所示。
图8 香烟类商品 波士顿矩阵分析从图8的象限矩阵图中,可以容易看出,仅有5款商品属于至少在订单量或销售额方面有所突出的商品。只需要简单的统计就可以看出,在第1、2、4象限的5款商品,总计订单量和销售额占比45%。这意味着其余几十款均是既不叫好又不叫座的商品,它们累计订单量和销售额只占总数的约55%。这是初步的简单划分。我们还可以通过对不同价位的香烟进行细分,了解不同价位商品的销售情况。这些分析都是十分基础的操作,将所有商品的订单量或销售额进行排序就可以,就不再专门展示图表。这里仅以中高价位的中华香烟举例。该门店的中华香烟销售情况占整个香烟商品销售额的13%,订单量却仅占2.5%。这就是典型的高价值顾客的消费结果——少量顾客贡献了较大份额的利润。事实上该门店的中华香烟销售额为门店总收入做出了显著贡献。在第3象限里,我们可以用同样方法进一步做细分分析,比如以单价划分。以价格这个维度观察不同顾客群的消费特征。
同样方法,我们分析下非香烟类商品的划分情况。如下方图9所示。
图9 非香烟类商品 波士顿矩阵分析从图中看到和香烟类相似的情况——除少量商品有一定突出的订单量和销售额占比外,大多数商品的绩效表现均较低。
其实这种情况在前面图3的价格带分析中已经初见端倪。大多数商品动销不佳,门店的营收呈现某种极端的马太效应。这是否意味着经营存在某种问题?其实这在零售业中比较常见。在日常零售中,只有少量商品是既有销量,又能带来营收的“硬通货”商品,而大多数商品是仅能在一段时间内有一定程度的动销表现。这表现为商品的动销生命周期。由于当前市场商品极大丰富,导致大多数商品的动销生命周期十分短暂。一家零售门店想要精细化运营,应当尽量准确把握商品的动销生命周期,对商品的采购/库存做出合理的控制。这就需要我们计算出每件商品的动销生命周期。
商品的动销生命周期
我们以非香烟类商品为例,展示商品动销生命周期。将那些并非每周都在动销的商品挑选出来,然后按时间排好。计算每隔一段时间,还有多少商品仍在动销。这个计算十分简单,仅是普通的统计。结果如下方图10所示。
图10 非香烟类商品动销生命周期这里我以周为时间单位,计算每过一周,还有多少商品产生动销。从图10可见,在第1周,所有的商品都有动销,但到第2周,就有约70%的商品无人问津了。然后动销率缓慢地下滑,在第6周降到11%。而到第9周时,仅剩下4.2%的商品仍保持动销。这里包含了大量的“大品牌”商品。当然图10反映的数据并不是十分可靠,因为它仅仅是基于一段时间内动销的抽样结果。经过一定修正的动销数据如下方图11所示。
图11 修正后的非香烟类商品动销生命周图11和图10所反映的事实并无二致。这说明什么?这意味着对这家门店而言,那些没能产生显著动销的商品,在这家门店最多仅能存在2个多月。在做这样的统计计算时,我已经把那些一直保持动销的商品排除在外。但那些始终能产生动销的商品也只是占总SKU数量的较小比例。这意味着对公司采购事务而言,不断寻找新的有吸引力的商品,是一个需要持续投入的事情,而且这项工作,在新货物上架第一天开始就得着手准备,因为在第1周结束时,就已经有至少3成的商品不得不被淘汰了。
寻找明星商品
通过上面的四步分析,我们已经对门店的经营状况有了初步的认识。发现问题不是目标,我们必须找出有效对策以提高经营效益。要做到这一点,我们得设法搞清楚,顾客喜欢在门店买什么。
想要发现这些明星单品并不难,但需要细心。我们得在门店POS系统的销售记录中仔细寻找。只需要对订单量、销售额,以及时间等维度进行切片,就可以观察出一些端倪。这种方法操作起来不难,称为RFM模型。以案例中该门店的非香烟类商品为例,计算得到的RFM分数片段如下图12所示。
图12 非香烟类商品RFM分数片段不过由于传统零售门店收集数据并不完善,我们无法获知每款SKU的首次上架日期,所以在该RFM模型中,对一些商品而言,R指标的结果是不够准确的,但它多少也能反映问题。用下方图13的曲线可以更好地展示多款SKU的RFM分值分布情况。
图13 非香烟类商品RFM分布从图13容易看出,仅有少量商品的RFM分数较高,然后迅速衰退到约0.4,此后就是缓慢的下降过程。这说明绝大多数商品的评估并不理想,因为RFM分数还不到0.4。结合前面分析的商品动销生命周期,它们很大可能在未来2个月内被淘汰下架。而那些分数相对较高,且长期保持稳定的商品(这需要持续跟踪观察),将作为该门店的明星商品长期占据货架。
除了上面这种基于事实的发现明星商品的方式,在零售中我们还不应忽视对商品本身卖点的观察和探索。这里举一个例子。在非香烟商品里,该门店典型的畅销商品之一是红牛,仅这一个单品,就可以贡献整体销售额的2%以上。大家不要小看这区区2%,要知道一家门店的SKU可以多达2000-3000个。2%是一个很显著的占比。那么红牛热卖,对门店经营者来说,真正有价值的信息是什么呢?是背后的顾客消费偏好。消费红牛的那些顾客,究竟是什么样的顾客?他/她究竟是因为怎样的需求,才愿意购买红牛呢?从红牛的本身功用可以猜测一二。红牛是一款功能性饮料,富含牛磺酸,起到提振精神的作用。这说明门店服务的顾客中,有一部分顾客是需要提振精神的——他们也许属于熬夜型人群,也许属于高强度脑力工作者。受此启发,门店是否可以考虑围绕这类顾客的需求,再引入其它一些相关商品,比如其它品种的提神饮料?受此启发,店员首先不妨尝试与一些顾客进行试探性交流,只需要一些看似漫不经心的寒暄,就可以多多少少获取顾客消费的动机。一旦确定了顾客确实是熬夜型人群或脑力工作者,那么接下来选品的思路也就自然确定了。比如富含牛磺酸的功能饮料还有很多,力保健、蓝罐红牛、东鹏等等。它们价格不一。结合价格带分析,可以填补适当的商品进入门店采购清单。但是在本案例中,查遍该门店销售记录,其它同类功能的商品的采购并非完全没有,但选购太少了,而且价格不是很合理。合理的选择应当是在红牛的价格区附近,再增加几款替代型产品。该门店非香烟类商品的价格带分析,如下图14所示。如果我们要为该门店决定采购目录,我们应该选哪些商品进入采购序列?
图14 非香烟商品价格带除了这种直接靠商品本身功能等明显属性寻找定位的方法外,我们也可以借助聚类和关联分析等数据挖掘手段,发现一些新的商品。但在数据探索阶段,我们通常不必如此大费周章。
决策
对门店的基本分析就告一段落。通过上述分析,我们已经详细地了解了门店经营状况。而这一切仅依靠POS收银记录和Excel就可以做到。其实我们可以做的分析还有很多,但对企业面临的一些重要问题,上述信息已经足够我们决策了。假设门店因某些外因,客流严重下降,假设下降了50%。作为企业决策者,到底要不要关店?面对这样的问题,我们不宜单纯依据销售/利润进行决策,因为那样太粗糙太草率了。市场信息瞬息万变,寻找到一些价值洼地反而可能给企业经营带来新的起色,质的飞跃。那对企业决策者来说,究竟宜根据什么做判断呢?要看门店经营的发展趋势。这个门店经营的发展趋势,既要看顾客质量,也要看经营状态。上面几步的分析,我们正是对这两方面做了一个初步的洞察。对门店顾客分析后可知,客户质量还是不错的。通过对连续两年的经营数据进行对比,可以发现门店拥有一批高价值顾客。门店业绩下滑后,这批高质量顾客的消费额不但没有降低,反而出现了少许的增长。这批高质量顾客也没有出现流失。业绩下滑主要源自那些中低价值的顾客群,这些顾客的特点是购买了那些价格/利润偏低的商品,而且订单价格也不高。从市场份额来看,门店仅占据了目标市场约25%的份额,剩余的75%潜力目标人群为什么没有在门店消费?答案可能在采购的商品中。商品定价不合理,也没有引起目标客群的消费兴趣。既然没有自己想要的东西,那不在门店消费就是很合理的结果。那些高价值顾客之所以频繁消费,无外乎是门店有他们想要的东西而已。所以门店业绩下滑,也许焦点不是考虑要不要关店,而是仔细思考是否给目标顾客人群提供了符合他们需要的商品。对一个零售业企业来说,这是对顾客提供的最起码的价值。
本篇的数据探索过程,是真实分析过程的一个片段。通过将分析过程中关键几个节点展示出来,显示商业分析对企业经营决策的辅助作用。除此之外,该案例实际上还给读者一个额外的启示——企业应该重视对IT系统的投入。通过本案例,我们至少可以看到有关这方面值得优化的两个地方。一个是线下零售企业使用的传统POS收银系统。传统POS系统最大的问题并非不能识别消费者身份,而是数据库结构设计不尽合理。在实际本案例中,POS系统记录退货商品,是新增一条订单ID,这就给分析过程带来了很多不便。这也实际上反映了POS收银系统在语义上的混淆。由于传统线下行业并不过多关注IT技术,所以对这方面问题很难有察觉。过去一些传统的软件供应商,没有过多考虑这方面的因素,仅仅做到了“能用就好”的POS系统。在不需要对销售数据进行分析就能做生意的时代,POS收银系统确实能用就行了,但如今越来越依靠对经营数据的深入分析和挖掘,这种仅仅“够用”的POS收银就必须要谨慎采购了。因为一旦购买了这样的收银系统,就很可能意味着企业无法做有效的数据分析,POS系统就真成了一个仅仅用于收银的流水账记录本。另一个就是对零售企业来说,应认真思考识别消费者身份信息的问题。假设零售企业像电商那样,可以记录下每名顾客的身份信息,那么在本文中的顾客人数和顾客价值分析这两方面,将有完全不同的分析思路,而且结果更加准确。那时企业将可以追踪分析顾客个人的消费行为,并为顾客设置更丰富的画像,这将使选品采购进入更高的精细化水平。对此,我的建议是,零售企业确实应该认真考虑利用一些APP开辟线上销售的可能。