有两种新建途径:单个新建原始特征、批量新建原始特征。
定义原始特征的名称、类别、字段类型、离线数据源、在线数据源。
配置到在线数据源中的特征后续可在发布到线上后用于在线预估、流式样本或用于在线模型。
online_req 在线数据源是指调用推荐接口 API 时通过在 context.feature
中传入参数来获取客户端实时特征的方式(详情可参考:推荐接口(predict))。当在线数据源选择“oneline_req”时,可以看到传入的参数列表,选中后就定义为用于后续特征抽取的原始字段了。
说明
如果需要将 spm 定义为特征,除了在推荐接口 API 中的传入 context.spm
参数外,需要同时将在 context.feature
中按需传入 bhv_spm 及 bhv_spm_{x},x ∈ [1,2,3,4]。
推荐在填写原始特征名称时增加类似“_v01”的后缀,一方面可以用于标识版本,另一个方面还能避免重名。
例如:user_7d_tpl_doc_cate3_favorite_score_list
推荐命名为 tpl_user_7d_tpl_doc_cate3_favorite_score_list_v01
。
批量创建原始特征分为两步:
对于不再需要的原始特征,建议及时归档,以保持原始特征列表中都是还在使用的原始特征。不同于删除,归档操作只会将原始特征从列表中移除,使其不再可见,并不会真正将其从磁盘中删除。因此,您在新建原始特征时无法使用已归档的原始特征名称。