- 文档首页
AI 数据湖服务
产品动态与公告
产品动态
功能发布记录(2026)
功能发布记录(2026)
2026年02月09日
发版版本:LAS AI 1.0.0 版本。
功能模块 | 功能说明 | 发布地域 |
|---|
算子广场 | 算子广场发布 0.7.2 版本: - 当前版本新增算子19个(离线:18;在线:1)。
- 支持了豆包类算子的Job模式调用能力(当前仅多模态深度思考-豆包系列 算子支持)。
- 提升了在线体验功能的操作体验。
更多关于算子的发布详情请参见算子库发布记录。 |
LAS 数据处理 Agent | - LAS 数据处理 Agent 能力优化升级,通过优化改进,提高了数据处理代码生成质量。
| |
开发机 & 任务管理 | 开发机/任务的存储挂载新增支持基于 Native 协议的方式挂载 vePFS,即,自当前版本开始,挂载 vePFS 时,您可基于 FSX 协议或 Native 协议去挂载。 - 基于 FSX:
- 挂载前,您需要在 vePFS 中手动创建 FSX 协议服务、FSX 接入点。
- 创建完成后,即可在 LAS 中挂载 vePFS 时选择您创建的接入点。
- 注意,此种方式挂载时,您需开启网络连接,配置 VPC 与 vePFS 接入点的VPC为同一个 VPC。
- 基于 Native:
- 挂载前,您需联系技术支持人员为您创建好挂载服务。
- 完成挂载服务准备,即可在 LAS 中基于 Native 方式挂载 vePFS。
- 通过此种方式挂载时,您无需特别配置任务的网络连接。
更多关于存储挂载的介绍请参见存储挂载说明。 | |
在 LAS 中进行任务开发运行时,新增支持配置跨 VPC 启用 PrivateZone 的功能。

当任务执行过程中需访问某 VPC 环境中的服务,例如,任务需访问挂载的 vePFS 文件系统,则给任务配置好同一 VPC 网络时,新增支持打开 PrivateZone 开关,开启后,您即可以使用 VPC 内的 DNS 解析规则来进行DNS解析。 注意 PrivateZone 设置仅在任务提交到独占队列时生效。 更多关于任务的介绍与操作指导请参见任务管理。 | |
镜像管理 | 基于开发机创建自定义镜像功能优化: - 新增支持排除部分无用目录,提高镜像制作效率。
- 新增支持查看镜像制作日志,并支持对制作中的镜像进行”停止“操作。

更多关于自定义镜像制作与管理操作请参见镜像管理。 | |
运维监控 | 优化 LAS 的运维监控能力: - 算子服务页面新增接入更多在线算子,支持更多在线算子的指标监控。
- 联合云监控产品对各 LAS 功能模块的事件进行监控时,新增支持在事件详情中记录LAS 任务实例的执行情况(例如,任务实例所属任务id、任务实例执行状态等),便于基于事件详情对 LAS 任务进行后续处理。
更多关于 LAS 运维监控能力的说明请参见LAS 运维与监控概述。 | |
Lance 数据集 | - 基于 Daft 处理 Lance 数据集时,新增支持通过
df.write_lance(mode="merge")实现直接新增列到现有的 Lance 数据集中(例如,跨批次应用 UDF 并持久化结果)。 - 使用 veDaft 来处理 LAS 中的 Lance 数据集时,也可便捷的进行加列操作,详情请参见应用实践:基于veDaft的数据集使用说明。
| |
2026年01月29日
发版版本:LAS AI 0.11.4 版本。
功能模块 | 功能说明 | 发布地域 |
|---|
算子广场 | - 多模态深度思考(Doubao-seed-1.8)算子:首次发布上线此算子。
- 图文 embedding(豆包系列)算子:新增支持在线调用方式,即,您可以通过API方式调用算子进行图文向量化处理。
- seedance视频生成(豆包系列)算子:算子调用的API能力升级,新增支持doubao-seedance-1-5-pro模型,并新增支持通过更多入参配置来提高视频生成质量。
- 图片生成(Seedream 系列模型)算子:算子调用方式升级优化,提高算子调用的操作体验。
详情请参见算子库发布记录。 |
OpenAPI | 新增支持数据面 OpenAPI:对话(Chat)API,您可以便捷地调用LAS API,详情请参见 对话(Chat)API。 | |
2026年01月22日
发版版本:LAS AI 0.11.2版本。
功能模块 | 功能说明 | 发布地域 |
|---|
算子广场 | - 视频内容理解(豆包系列)增强版算子新增支持:doubao-seed-1.8 模型。
详情请参见算子库发布记录。 |
2026年01月15日
发版版本:LAS AI 0.11.1版本。
功能模块 | 功能说明 | 发布地域 |
|---|
算子广场 | - 新增发布离线算子4个(PPT文件转换、图片人脸模糊、图片人脸检测、视频人脸模糊),在线算子5个(图片生成(Seedream 系列模型)、音频格式转换、PDF文档解析(豆包)、语音转文字(豆包系列)、音频切分)。
- 算子新增支持以下模型**:**doubao-seed-1.8、doubao-seedream-4.5、doubao-seedream-4.0、Deepseek-V3.2
详情请参见算子库发布记录。 |
数据处理 | 在开发机、任务中配置环境变量时,新增支持文本模式的变量配置方式。

如上图所示: - 您可以按照
key:value 的格式,在文本框中直接输入环境变量名和变量取值。 - 支持输入多个环境变量,通过换行分隔多个环境变量。
| |
数据集 | 增强了LAS AI的数据集和数据湖-Catalog的功能协同性,提高元数据管理和元数据的一致性。细分功能点包括: - 创建Lance、Iceberg格式的数据集时,支持同步将数据集相关元数据注册为Catalog中的一张表,便于用户在Catalog进行元数据管理和存储优化。
 说明 - 进行此操作时,您需具备在对应Catalog中创建表的操作权限。
- 后续如果您删除了对应的数据集,则对应Catalog中同步注册的表也会同步删除。
- 支持在元数据页面中,直接基于Lance、Iceberg表创建数据集,创建好数据集后,后续如果在Catalog中删除对应表,也会同步删除对应数据集。
 - 将数据集和Catalog联动后,后续数据集和Catalog表中的元数据均从TOS中同步,保障了元数据的一致性、同步性。
| |
资源管理 | 修改资源预留策略,当前版本将资源预留策略修改为:预留 CU = Min(4CU,15%*CU),即,预留CU数改为:4CU 与 15%*队列CU 取小值。
更多关于资源预留的说明请参见队列预留资源策略。 | |
2026年01月08日
发布版本:LAS AI 0.11.0版本。
功能模块 | 功能说明 | 发布地域 |
|---|
算子广场 | 新增发布离线算子17个(视频音频检测、视频安全性检测、图片Hash等),并优化升级了多个算子能力,详情请参见算子库发布记录。 |
LAS Agent | 首次发布LAS Agent,LAS 数据处理 Agent 是面向企业开发团队的 AI 助手,通过自然语言对话,自动搭建端到端的数据处理链路并生成运行代码,灵活调用 100+ AI 算子,融合豆包、DeepSeek 等大模型能力,支持工具调用、代码诊断、数据探查等,帮助企业告别繁琐的数据开发工作,更轻松、更快速地获得高质量数据,加速模型训练、应用落地。
 - 当前 LAS 数据处理 Agent 为Beta版,暂不收费,完成企业认证的火山引擎账号在开通 AI 数据湖服务后,均可使用,当前为每个新用户默认提供 500W Tokens 的用量,您可直接进行试用。
- 当前 LAS 数据处理 Agent 仅上线华北2(北京)地域。
详情请参见LAS 数据处理 Agent。 | |
资源管理 | 优化升级了 AI 数据湖服务的队列资源应用策略,当前版本开始,您可以使用已创建好的EMR serverless队列资源作为 AI 数据湖服务的“独占队列”(推荐此种方式),灵活应用于开发机创建和任务运行,进一步提高队列资源的使用灵活度和利用率。
如下图所示,以创建开发机为例,您可选用EMR serverless队列作为“独占队列”。

优化后: - 后续不再区分“通用队列”与“计算队列”资源,AI 数据湖的资源将统一为“计算队列”,EMR Serverless队列为“独占队列”,在 AI 数据湖页面直接创建的队列标识为“计算队列”。
- 此前已购买的计算/通用队列资源可继续使用,应用方式与优化后的方式一致,均可应用于开发机或任务调度场景中,但后续历史的队列资源将不再进行新功能演进,建议您后续使用优化后的EMR Serverless 队列。
更多关于队列资源的介绍和使用说明请参见队列管理。 | |
算子服务 | 首次发布算子服务功能页面,为您提供了多时间粒度下,在线算子的Token速率、请求错误量等监控指标,并为您提供了全局算子使用的运维监控页面。
 - 当前算子服务仅支持以下地域:华北2(北京)、华东2(上海)。
- 当前算子服务支持监控的为在线算子,暂不支持离线算子。
- 当前支持查看最多最近30天的监控指标数据。
更多算子服务的功能详情请参见算子服务。 | |
数据处理 | 开发机页面新增支持通过复制功能来快速创建一个与已有开发机相同配置的开发机。
 | |
任务实例页面新增支持基于运行人进行实例筛选,并支持对任务实例进行“重试”操作。
 | |
工作流页面中,新增支持对单个任务设置任务的环境变量能力。
 | |
Daft引擎能力升级,新增Daft checkpoint功能,在批量数据写入的生产环境中,实现“断点续算”和“增量追加”,利用上次写入的结果进行去重,过滤掉不必要的计算。
详情请参见断点续算与增量计算:Daft Checkpoint。 | |
数据集 | 数据集能力升级优化: - 支持的数据格式扩展:数据集支持的数据格式扩展,新增支持Lerobot格式数据。
 注意 当前Lerobot数据格式功能默认关闭,如果您希望使用此数据格式,可联系技术支持人员,申请开通功能白名单,开通后才可创建此格式的数据集。 - 优化数据集路径解析策略:
- 新增数据集时,数据来源的路径解析策略与TOS的路径解析策略保持一致。
- 对于csv\jsonl\parquet格式数据集,后续进行SQL数据查询时,新增支持查询数据来源路径下更深层级的数据,此前仅支持查询数据来源路径下的一级数据文件。
- Lance类的数据集,新增支持预览图片/视频等数据能力。

| |
数据集页面操作体验优化: - 查找数据集的筛选条件优化,新增支持通过创建时间进行筛选。
 - 其他:优化了一些界面操作提示文案和交互体验。
| |
湖管理 | - 新增支持基于Lance、Iceberg表创建数据集能力。
 - 操作体验优化,您可以直接创建Catalog而无需关注数据类型,在后续创建表时区分Hive、Iceberg、Paimon、Lance表格式。
- 创建Catalog
 - 创建数据表

- 增强了对Lance格式的支持,当 Lance 表发生变化(如新增/修改字段)时,支持用户在数据湖-元数据获取lance表的字段更新。

| |
最近更新时间:2026.02.10 18:46:34