You need to enable JavaScript to run this app.
导航
物品数据集概述
最近更新时间:2025.10.14 23:36:08首次发布时间:2025.10.14 23:36:08
复制全文
我的收藏
有用
有用
无用
无用

物品数据(又称为候选数据)是AI 搜索和推荐的最基础的数据源。在AI 搜索引擎中使用“物品数据集”来进行物品数据的定义、上传和管理。经过配置的物品数据集将在应用中进行索引构建,并应用于搜索和推荐。

物品数据集是结构化的数据表,每条数据有一个唯一的ID和包含物品信息的属性字段。物品数据的使用多层的JSON对象来表征,您可以将商品、内容素材、新闻资讯、视频等各类内容结构化为“字段:值”的形式导入并使用平台进行处理和存储。
AI 搜索引擎支持2类数据集:

  • 基础图文物品数据集(见:图文物品数据集介绍):​适用于包含文本字段和图片字段的多模态内容,例如商品数据、文章资讯数据等。图文数据集暂不支持包含视频文件的数据。
  • 视频数据集(见:视频数据集介绍): 专门用于视频平台的搜索和推荐的数据集,可导入包含视频媒资元信息和视频文件的数据,例如影视剧内容、短视频、教学课程、新闻报道视频等。视频数据集支持视频系列-视频的父子层级内容结构,可适配电视剧、课程视频等一个系列包含多个视频序列的场景。

在平台创建应用之前,您需要基于您的搜索和推荐候选数据的内容特性准备物品数据集。可参照下方表格选择适合的数据集类型:

数据集类型

数据表定义

支持传入的内容

适用内容题材

图文物品数据集

自由字段,无固定数据schema

  • 文本字段
  • 图片字段(支持图片URL和Base64传入方式)
  • 商品数据
  • 图文咨询、博文内容
  • 新闻内容
  • 商用素材图片数据

视频数据集

存在预置字段来存储必要的ID、是否为视频系列、视频序号、视频下载链接等信息

  • 文本字段
  • 图片字段(视频封面或海报,供展示)
  • 视频文件字段(支持视频文件URL传入)
  • 影视剧数据
  • 视频课程
  • 短视频数据