You need to enable JavaScript to run this app.
导航
原始特征
最近更新时间:2023.04.13 09:59:56首次发布时间:2022.10.09 14:06:09
我的收藏
有用
有用
无用
无用

新建原始特征

有两种新建途径:单个新建原始特征、批量新建原始特征。
图片

单个新建原始特征

定义原始特征的名称、类别、字段类型、离线数据源、在线数据源。

  • 类别可选 Item 类、Pitem 类、User 类、Context 类。
  • 数据源需要同时满足以下筛选条件才可以被选到:
    • Item 类和 Pitem 类原始特征需要从含有 Item 主键的数据源中选择;User 类原始特征需要从含有 User 类主键的数据源中选择;Context 类原始特征需要从同时含有 Item 类和 User 类主键的数据源或者 online_req (在线请求API)中选择;
    • 离线数据源只能选择表格类、天级窗口聚合类表;在线数据源只能选择 KV 类、天内(小时级或分钟级)窗口聚合类表、online_req (在线请求 API)。
  • 数据源包括数据源表和字段,只填写数据源表,信息不会保存。并且要至少配置一种数据源才能提交保存。
    图片

关于在线数据源

配置到在线数据源中的特征后续可在发布到线上后用于在线预估、流式样本或用于在线模型。
online_req 在线数据源是指调用推荐接口 API 时通过在 context.feature 中传入参数来获取客户端实时特征的方式(详情可参考:推荐接口(predict))。当在线数据源选择“oneline_req”时,可以看到传入的参数列表,选中后就定义为用于后续特征抽取的原始字段了。

说明

如果需要将 spm 定义为特征,除了在推荐接口 API 中的传入 context.spm 参数外,需要同时将在 context.feature 中按需传入 bhv_spm 及 bhv_spm_{x},x ∈ [1,2,3,4]。

关于原始特征命名

推荐在填写原始特征名称时增加类似“_v01”的后缀,一方面可以用于标识版本,另一个方面还能避免重名。
例如:user_7d_tpl_doc_cate3_favorite_score_list 推荐命名为 tpl_user_7d_tpl_doc_cate3_favorite_score_list_v01

批量新建原始特征

批量创建原始特征分为两步:

  1. Step1,配置原始特征的批量生成规则,生成待新建的原始特征列表;
  2. Step2,检查待新建的原始特征的正确性,按需调整待新建的原始特征范围;
    需要注意的是,在 Step2 中,您需要翻页检查并确认所有原始特征的正确性。在检查的过程中,您也可以根据实际需求调整待生成的原始特征范围。
    图片

归档原始特征

对于不再需要的原始特征,建议及时归档,以保持原始特征列表中都是还在使用的原始特征。不同于删除,归档操作只会将原始特征从列表中移除,使其不再可见,并不会真正将其从磁盘中删除。因此,您在新建原始特征时无法使用已归档的原始特征名称。