航空公司的用户价值识别与产品匹配
来源: / 作者: / 时间:2019-10-29
案例概述:面对激烈的市场竞争,各个航空公司都推出了更优惠的营销方式来吸引更多的客户,某航空公司面临着旅客流失、竞争力下降和航空资源未充分利用等经营危机。通过建立合理的客户价值评估模型,对客户进行分群,分析比较不同客户群的客户价值,并制定相应的营销策略,对不同客户群体提供个性化的客户服务是必须和有效的。目前该航空公司已积累了大量的会员档案信息和其乘坐航班记录。请根据这些数据实现以下目标:
1、 借助航空公司客户数据,对客户进行分类。
2、 对不同客户类别进行特征分析,比较不同类客户的客户价值。
3、 对不同价值的客户类别提供个性化服务,制定相应的营销策略。
分析过程:
一、 数据探索
1. 首先通过初步探索数据,发现数据特征。本案例中我们主要对数据进行缺失值及异常值分析。
2. 通过pandas内置describe()方法初步探索数据发现,原始数据中存在票价为空、票价(SUM_YR_1/SUM_YP_2)小值为0、折扣率(avg_discount)小值为0、总飞行公里数(seg_km_sum)大于0的记录。分析可知:票价为空的对象,可能是客户不存在乘机记录造成的;其他数据可能是客户乘坐0折机票或者积分兑换产生的。
二、 数据预处理
1. 数据清洗:根据数据探索结果可知,原始数据量大,数据中的缺失值、票价小值为0、折扣率小值为0、总飞行公里数大于0的记录占原始数据比例较小,对问题影响不大,因此可以对其进行删除。
丢弃:①票价为0。
②票价为0及折扣率不为0及飞行公里数大于0。
2. 属性规约:原始数据中属性太多,根据客户价值识别应用广泛的RFM模型(近消费时间间隔、消费频率、消费金额),我们构建适合本案例的L(客户关系长度)、R(消费时间间隔)、F(消费频率)、M(飞行里程)和C(折扣系数平均值)五个指标,然后对案例进行分析。
针对以上LRFMC五个指标,我们只保留原始数据的6个属性:入会时间(FFP_DATE)、结束时间(LOAD_TIME)、飞行次数(FLIGHT_COUNT)、平均折扣率(AVG_DISCOUNT)、总飞行公里数(SEG_KM_SUM)、一次乘机时间至观察窗口末端时长(LAST_TO_END)。
3. 数据变换:将提取出的属性根据分析需要转换成适当的格式,此案例我们根据原有属性构造需要的指标LRFM,然后对数据进行标准化,从而更好地进行分析。
需要构造的新指标:
L= LOAD_TIME – FFP_DATE
R= LAST_TO_END
F= FLIGHT_COUNT
M= SEG_KM_SUM
C= AVG_DISCOUNT
4. 提取新指标后观察数据,不难看出5个指标数据取值范围差异较大,在建模分析前,为了消除数量级带来的影响,我们需要对数据进行标准化处理。此处选择零均值标准化。
三、 模型构建
客户价值分析模型首先通过KMeans对航空公司客户的5个指标进行聚类分析,将客户分成5类。然后根据各类客户的特征分析各群体客户价值。
1. 重要保持客户:这类客户的平均折扣率(C)高(一般所乘航班的舱位等级较高),近乘坐本公司航班(R)低,乘坐次数(F)或里程(M)较高。他们是航空公司的高价值客户。对航空公司贡献,但是占比却很小。航空公司应该优先将资源放到他们身上,对他们进行差异化管理和一对一营销,提高此类客户的忠诚度和满意度。
2. 重要发展客户:这类客户的平均折扣率(C)较高,近乘坐本公司航班(R)低,乘坐的次数(F)或里程(M)较低。这类客户入户时长(L)短,他们是航空公司的潜在价值客户。虽然这类客户的当前价值并不是很高,但却有很大的发展潜力。
3. 重要挽留客户:这类客户过去所乘航班的平均折扣率(C)、乘坐次数(F)或者里程数(M)较高,但是较长时间已经没有乘坐本公司航班(R)或是乘坐频率较小。这类客户价值变化不确定性高。由于这些客户衰退的原因各不相同,所以掌握客户的消息、维持与客户的互动就很重要。航空公司应该根据这些客户的近消费时间、消费次数的变化等,推测客户消费的变化状况,列出客户名单,重点联系,采取一定的营销手段,延长客户生命周期。
4. 一般与低价值客户:这类客户所乘航班的平均折扣率(C)很低,较长时间没有乘坐本公司航班(R),乘坐次数(F)或里程(M)较低,入会时间短(C)。这类客户是航空公司的一般用户与低价值客户,可能是航空公司打折促销期间,才会乘坐航班。