物品数据集是驱动本平台精准搜索、推荐和对话能力的核心数据基础。本章节将为您提供详细的操作指引,帮助您一步步将自有数据导入并构建成一个结构化的物品数据集,内容涵盖数据上传、信息配置和策略设定等关键环节。
数据集的准备和创建方式取决于您要导入的数据类型。首先,确定您计划创建哪类数据集:
图文数据集
视频数据集
请注意: 本章主要聚焦于操作流程。如果您对物品数据集的基本概念、支持的数据格式、各个字段类型的具体定义、参数的详细解释或搜索策略等理论性内容有疑问,请先查阅数据集介绍章节。理解该章节的基础知识将帮助您更顺畅、更有效地完成本章的实践操作。
图文数据集
启动创建
本起始步骤旨在引导您进入创建数据集页面,并启动创建流程。
- 在AI搜索控制台中,转到数据集页面。
- 点击创建数据集,在弹出的弹窗中选择物品数据集,并点击立即创建,您将正式进入创建数据集的流程中。
上传数据

本步骤中我们将引导您完成新图文数据集的命名,并上传您的样例文件用于解析数据字段和生成配置。
在创建数据集页面中填写数据集名称。
在数据集类型中选择图文数据。
上传数据,在这里上传一部分数据样本。将帮助系统自动识别数据字段并生成初始配置。请放心,这只是用于配置预览,您可以稍后决定是否将这些数据正式添加入数据集。系统支持两种上传方式,您可点击上传控件下方的切换按钮来选择您偏好的方式:
说明
- 必须包含唯一标识符:每条记录必须包含一个String类型的唯一ID字段,作为检索基础
- 多条数据的schema一致:同名字段格式冲突会导致报错
- 支持多层次数据结构:系统可处理最深3层的嵌套对象,能够有效索引和检索深层属性
- 图片数据上传:您可以上传多个图片字段,字段类型为String或Array ,字段内容为图片URL(或URL列表),请确保URL可公网访问
- 图像资源处理:支持您使用URL引用的方式传入图片,图片需要在专门的JSON属性内上传,建议图片大小控制在5MB以下
- 上传JSONL文件:点击/拖拽JSONL文件,格式需遵循标准的JSONL规范,按行写入多条数据,文件大小不超过10MB。
- 粘贴JSON数据:使用JSON对象(或对象列表Arrayof Objects)格式,粘贴单条或多条图文数据。建议粘贴100条以内数据,请您在输入时必须遵循标准JSON格式。
下方的示例展示了我们所要求的标准 JSON 格式:
{
"item_id": "product_123",
"name": "新款时尚连衣裙",
"price": 299.00,
"current_price": 249.00,
"description": "优雅修身,适合各种场合。",
"images": [
{
"image_url": "https://example.com/images/dress_1.jpg"
},
{
"image_url": "https://example.com/images/dress_2.jpg"
}
],
"category": "女装",
"key_words": ["连衣裙", "时尚", "优雅", "修身", "女装"]
}
上传 / 输入完成后,点击下一步:配置字段,进入配置数据部分。
添加字段
平台会根据您上传的样例数据自动识别大部分数据字段,但在某些情况下,您可能需要手动添加字段。平台提供了以下两种方式来手动添加字段:

方法一:字段列表的上方,点击蓝色的**+ 添加字段按钮添加新字段。

方法二:对于数据类型为对象 (Object)** 或对象数组 (Array