You need to enable JavaScript to run this app.
导航

汽车用户意向标签预测

最近更新时间2023.05.24 20:55:51

首次发布时间2021.08.19 11:18:57

1. 场景概述

汽车营销有丰富的意向推荐场景,比如常见的选装包意向推荐、潜客购车意向预判、换新/维修意向预测,业务人员可以结合用户全生命周期的管理,对不同生命周期的用户群体采取不同的营销策略,如:

  • 对无感知用户:进行汽车品牌/车型介绍,学车知识推送

  • 学车用户:汽车品牌/车型介绍,购车需求了解,学车知识,购车知识

  • 计划买车用户:汽车品牌/车型介绍,买车时间,买车预算,意向车型推送,购车知识,汽车优惠推广

  • 即将购车用户:汽车品牌/车型介绍,买车时间,买车预算,意向车型推送,购车知识,汽车优惠推广,留资

  • 刚买车用户:汽车品牌/车型介绍,买车时间,品牌车型,汽车优惠活动,留资,购车知识

  • 老车主:汽车品牌/车型介绍,复购换购需求,买车预算,意向车品牌,换购留资,汽车知识,优惠活动


本案例针对计划购车、即将购车、老车主的场景,采用机器学习的方式,推算用户的购车意向,用历史留存的购车及换购用户数据来做训练,对符合三种生命周期的用户做购车意向预测,并采取合适的营销手段。

2. 建模过程

2.1 数据描述

字段名称字段类型字段意义字段说明
uidbigint用户id-
genderstring性别性别:男、女
agestring年龄段年龄段:18-23、24-30、31-40、41-50、51-
areastring常驻地常驻地-区
lifestagestring人生阶段人生阶段:征婚、备婚、孕期、已育
educationstring学历学历:高中及以下、专科、本科、硕士及以上
jobstring职业职业:留学生、医生、律师、教师、蓝领、白领、其余
birthdaystring生日生日
lifecyclestring生命周期生命周期:粉丝、潜客、车主、流失
own_storestring所属门店所属门店:中环广汇、浦东永达、其余
own_salesstring负责销售负责销售:道森、王宁、罗伯特
wanted_storestring意向经销商:意向经销商:浦东永达、中环广汇
wanted_carmodelstring意向车型意向车型:RX5 Plus、ER6、RX3、i5、i6、iMAX8、未知
rankstring意向评级意向评级:高、中、低、已成交
lasttime_pudongyongda_testdrivestring上次门店试驾时间上次门店试驾时间:1周内、2周内、1月内、2月内、3月内、半年内、一年内
newcar_tastingstring新车品鉴会新车品鉴会:是、否
storetimes_lastthreemonthstring近3个月访问经销商次数近3个月访问经销商次数:0、1、2、3、4、>4
storenumbers_lastthreemonthstring近3个月访问经销商个数近3个月访问经销商个数:0、1、2、3、4、>4
warranty_timesint质保期内进店次数质保期内进店次数:0、1、2、3、4、5
warranty_valuesstring质保期内服务总价值质保期内服务总价值:03000、30005000、5000~10000、>10000
pudongyongda_noentry_timestring未进入本店时长未进入本店(浦东永达)时长:1个月、2个月、3个月、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月、12个月
forwardtimes_lastthreemonthstring近3个月累计转发近3个月累计转发:<3、35、610、>10
publishtimes_lastmonthstring近1个月发帖数近1个月发帖数:0、1、2、3、4、>4
applets_opentimes_lastmonthint近1个月小程序打开次数近1个月小程序打开次数
optionalpackpage_opentimes_lastmonthint近一个月选装包页打开次数近一个月选装包页打开次数
optionalpackpage_time_lastmonthint近一个月选装包页浏览时长近一个月选装包页浏览时长。单位:min
last_etaint当前eta当前eta。单位:天
eta_modifytimesstringeta修改次数eta修改次数:0、1、2、3、4、>4
pointuse_lastmonthstring近一个月是否使用过积分近一个月是否使用过积分:是、否
point_countstring积分量积分量:0-500、500-10000、10000-30000、30000以上
active_lasttimestring上一次活跃时间上一次活跃时间
contact_preferencestring触点偏好触点偏好
gift_preferencestring精品品类偏好精品品类偏好
carownerstring本品车主本品车主
salescarmodelstring本品成交车型本品成交车型
salestimestring本品成交日期本品成交日期
carownerappvisitstring车主app访问频率车主app访问频率
othercarmodelstring其余持有车型其余持有车型
interest_car_pricestring汽车价格汽车价格
interest_car_brand_countrystring汽车国别汽车国别
interest_car_brandstring汽车品牌汽车品牌
interest_car_other_series_typestring汽车车型汽车车型
interest_car_newenergy_typestring新能源类型新能源类型
client_stagestring客户阶段客户阶段
channelstring留资渠道留资渠道
community_pv_lastweekint过去一周的社区pv过去一周的社区pv
community_creation_lastweekint过去一周的社区内容创造过去一周的社区内容创造
community_forward_lastweekint过去一周的社区转发过去一周的社区转发
community_recruit_lastweekint过去一周的社区拉新过去一周的社区拉新
car_optical_pack_eagernessstring选装包偏好选装包偏好
car_pick_up_eagernessstring提车迫切度提车迫切度
returned_customerstring回头客回头客
car_price_comparisonstring跨店比价跨店比价
stored_many_pointsstring积分大量囤积积分大量囤积
club_freshmanstring俱乐部新手俱乐部新手
recall_valuesstring流失召回价值流失召回价值

数据中包含了大部分经过数据处理的关键性指标,包括用户的生命周期/活跃度/渠道信息/个人属性等,利用这样结构化的数据,直接经过简单的建模,可以对意向评级进行预测,从而进行精准营销。

2.2 数据准备

通过直连hive数据完成数据的接入,此案例分为两份数据,即历史手工标记数据和新产生数据。对历史标记数据针对意向评级进行进行分类训练,对新数据进行意向预测。

2.3 问题建模

选择核心的指标进行意向训练,由于前置完成了数据处理,可以理解所有的指标都核心影响意向的选择,所以这里无须进行特征筛选/特征处理工作,经过简单的逻辑回归,即可达到目标要求。

2.4 模型评估

支持训练模型评估的功能,辅助用户手动调参。参考下图的混淆矩阵,显示了模型最终效果的召回和精确率,显示不同分类情况下,用测试集的性能,同时还支持加权召回率、加权查准率、准确率的计算。

2.5 数据生产应用

在得到效果较好的模型之后,可以将预测的结果输出到hive/clickhosue,后续可以在DataWind平台中进行可视化查询/创建仪表盘大屏。也可以结合CDP产品,进行标签洞察/营销应用/用户分群等。