文档首页 AI 数据湖服务 产品动态与公告 产品动态 功能发布记录(2026) 功能发布记录(2026)
2026年04月08日
发版版本:LAS AI 1.1.0 版本。
功能模块
功能说明
发布地域
算子广场
PDF 文档解析(豆包) :算子能力升级,支持解析的PDF文档页数上限提高至 400 页(此前为 200 页),超出 400 页的PDF文档建议通过 start_page 和 num_pages 参数分开多次请求解析。视频内容理解(豆包系列)增强版 :算子优化,算子调用方式升级为 Chat 接口的调用方式。控制台操作体验优化:控制台算子广场页面视觉优化,通过更明确的标签和布局优化,提高算子查找体验。 更多算子新增支持在线体验能力,您可以在算子卡片中便捷地进入对应算子的体验入口,更多关于在线体验的介绍请参见快速体验 。 算子服务
算子服务能力优化:
算子覆盖度更广:当前支持查看所有在线算子的监控指标。 算子监控指标更全:丰富了各算子的监控指标,覆盖各算子更多的关键指标。 资源管理
LAS API key 的功能优化:
每个主账号支持创建的 LAS API Key 数量上限提高到 20 个。 新增支持查看每个 LAS API Key 的上一次使用时间(活跃时间),您可以在 API Key 管理页面查看对应时间。 更多关于LAS API key 的介绍请参见API Key 管理 。
数据集
新建数据集共享时,当访问类型为直接访问时,您可以根据需要选择是否打开开放写权限开关。
开启后允许接收方写入/删除数据,接受方可向该数据集注入或更新数据。 此配置通常用于接受方向您交付数据的场景,请确保您信任该伙伴。
更多关于数据集共享的操作指导请参见数据集共享 。
对于可直接访问的共享数据集,接受方新增支持将数据集另存为自己账号下的 LAS 数据集,对应的数据保存在自己的 TOS 上。
更多关于另存为LAS数据集的介绍请参见场景2:数据集另存为 LAS 数据集 。
数据处理
开发机新增支持使用用户的公网 NAT 网关的公网 IP 来访问开发机,从而保障使用公网 SSH 开发机的体验。
更多关于开发机的配置指导请参见创建开发机 。 工作流新增支持对单个任务节点设置重试开关,打开重试开关后支持配置当前任务节点运行失败后的重试策略。更多介绍可参见工作流 。 通用
界面操作体验优化,例如一些列表页面新增支持手动刷新列表状态的按钮等。
2026年03月31日
发版版本:LAS AI 1.0.8 版本。
功能模块
功能说明
发布地域
算子广场
新增在线算子:音视频合并 、视频分镜 。 视频智能剪辑 算子能力升级:
新增支持 ASR 增强的语义理解,适用于对话内容丰富、无字幕的视频,提升片段边界流畅性。 增强对短剧场景的能力,支持短剧三要素渲染(标题、提示语、角标),适合短剧竖屏场景。 支持精彩前置功能,自动提取 10-15 秒具有吸引力的片段作为开场。 元数据管理
存储优化-孤儿文件治理,新增支持设置孤儿文件的保留策略参数,用来设置孤儿文件保留的时间范围,超出此处配置的时间范围的孤儿文件即会在优化任务执行时被清理。
更多关于孤儿文件治理的操作指导详情请参见孤儿文件治理 。
新增支持审计日志功能,开启后,将会为您自动将元数据管理的操作事件写入火山引擎日志服务产品(TLS),便于后续对此部分的操作进行回溯审计。
注意
审计日志功能需要您开通 TLS 服务并授权 ServiceForTLS,LAS 会创建 TLSCrossAccountTransformationForLAS 角色用来进行 TLS 日志投递,变更该角色会导致审计日志服务不可用。 开通日志审计功能后,后续写入 TLS 的事件会产生 TLS 的使用费用,此部分的费用会挂在 TLS 的费用账单中,计费详情请参见 TLS 计费文档 。 更多关于 LAS Catalog的审计日志功能介绍请参见:审计日志 。
支持使用 IAM 角色的方式登录并使用 LAS Catalog 功能,例如,可以使用角色来对接 EMR Serverless、DataLeap等服务,实现 Catalog 中库表的读写。
注意
暂不支持通过 角色 对Catalog 进行授权相关操作,有相关需求可通过DataLeap进行操作。
2026年03月17日
发版版本:LAS AI 1.0.5 版本。
2026年03月10日
发版版本:LAS AI 1.0.3 版本。
功能模块
功能说明
发布地域
算子广场
算子服务
算子服务新增支持监控 Seedance视频生成(豆包系列)算子的任务指标,包括任务并发数、排队任务数。
OpenAPI
新增支持数据面 OpenAPI:Response API,您可以便捷地调用LAS API,详情请参见 创建模型响应 。
数据集
LAS 数据集的存储优化功能优化升级。此版本中:
小文件合并功能:优化后,小文件合并任务支持通过分区过滤来圈定小文件合并范围,并支持更灵活的周期调度时间粒度。 快照清理:新增支持快照清理功能,支持创建快照清理任务,通过指定快照保留策略、清理任务的调度周期等,实现自动清除无用快照、实现存储优化。 说明
当前仅支持 Lance 和 Iceberg类型的表使用存储优化-小文件合并、快照清理功能。更多相关功能的操作指导请参见小文件合并 、快照清理 。
元数据
优化 Gravitino Iceberg REST Catalog 的操作体验,新增支持通过 X-Date 与 X-Expire 请求头控制 API 签名有效期。如果需要控制签名有效期,您可以在请求头中额外加入 X-Expire 字段。该字段与 X-Date 协同工作,用于控制有效天数。
更多关于设置 Gravitino Iceberg REST Catalog 签名有效期的示例可参见Gravitino Iceberg REST Catalog 使用说明 。
在线服务
优化升级在线服务功能。
部署在线服务时,新增支持设置多个端口号,当前每个在线服务支持设置 5 个自定义端口号。 新增支持终止某个在线服务实例。 更多关于在线服务的操作指导请参见在线服务 。
2026年02月27日
发版版本:LAS AI 1.0.2 版本。
功能模块
功能说明
发布地域
算子广场
“视频内容理解(豆包系列)增强版”算子新增支持douba-seed 2.0系列模型。包括:doubao-seed-2.0-pro、doubao-seed-2.0-mini、doubao-seed-2.0-lite。 "图片生成(Seedream 系列模型)"算子新增支持:
doubao-seedream5.0系列模型(doubao-seedream-5-0-lite-260128和doubao-seedream-5-0-260128); 支持doubao-seedream 5.0系列模型后,也新增支持请求参数tools(当前支持调用web_search工具)和output_format(指定生成图像的文件格式)。 “图片重采样”算子新增支持在线调用方式。
2026年02月09日
发版版本:LAS AI 1.0.0 版本。
功能模块
功能说明
发布地域
算子广场
算子广场发布 0.7.2 版本:
当前版本新增算子19个(离线:18;在线:1)。 支持了豆包类算子的Job模式调用能力(当前仅多模态深度思考-豆包系列 算子支持)。 提升了在线体验功能的操作体验。 更多关于算子的发布详情请参见算子库发布记录 。
LAS 数据处理 Agent
LAS 数据处理 Agent 能力优化升级,通过优化改进,提高了数据处理代码生成质量。 开发机 & 任务管理
开发机/任务的存储挂载新增支持基于 Native 协议的方式挂载 vePFS,即,自当前版本开始,挂载 vePFS 时,您可基于 FSX 协议或 Native 协议去挂载。
基于 FSX:
挂载前,您需要在 vePFS 中手动创建 FSX 协议服务、FSX 接入点。 创建完成后,即可在 LAS 中挂载 vePFS 时选择您创建的接入点。 注意,此种方式挂载时,您需开启网络连接,配置 VPC 与 vePFS 接入点的VPC为同一个 VPC。 基于 Native:
挂载前,您需联系技术支持人员为您创建好挂载服务。 完成挂载服务准备,即可在 LAS 中基于 Native 方式挂载 vePFS。 通过此种方式挂载时,您无需特别配置任务的网络连接。 更多关于存储挂载的介绍请参见存储挂载说明 。
在 LAS 中进行任务开发运行时,新增支持配置跨 VPC 启用 PrivateZone 的功能。
当任务执行过程中需访问某 VPC 环境中的服务,例如,任务需访问挂载的 vePFS 文件系统,则给任务配置好同一 VPC 网络时,新增支持打开 PrivateZone 开关,开启后,您即可以使用 VPC 内的 DNS 解析规则来进行DNS解析。
注意
PrivateZone 设置仅在任务提交到独占队列时生效。
更多关于任务的介绍与操作指导请参见任务管理 。
镜像管理
基于开发机创建自定义镜像功能优化:
新增支持排除部分无用目录,提高镜像制作效率。 新增支持查看镜像制作日志,并支持对制作中的镜像进行”停止“操作。 更多关于自定义镜像制作与管理操作请参见镜像管理 。
运维监控
优化 LAS 的运维监控能力:
算子服务页面新增接入更多在线算子,支持更多在线算子的指标监控。 联合云监控产品对各 LAS 功能模块的事件进行监控时,新增支持在事件详情中记录LAS 任务实例的执行情况(例如,任务实例所属任务id、任务实例执行状态等),便于基于事件详情对 LAS 任务进行后续处理。 更多关于 LAS 运维监控能力的说明请参见LAS 运维与监控概述 。
Lance 数据集
基于 Daft 处理 Lance 数据集时,新增支持通过df.write_lance(mode="merge")实现直接新增列到现有的 Lance 数据集中(例如,跨批次应用 UDF 并持久化结果)。 使用 veDaft 来处理 LAS 中的 Lance 数据集时,也可便捷的进行加列操作,详情请参见应用实践:基于veDaft的数据集使用说明 。
2026年01月29日
发版版本:LAS AI 0.11.4 版本。
功能模块
功能说明
发布地域
算子广场
多模态深度思考(Doubao-seed-1.8)算子:首次发布上线此算子。 图文 embedding(豆包系列)算子:新增支持在线调用方式,即,您可以通过API方式调用算子进行图文向量化处理。 seedance视频生成(豆包系列)算子:算子调用的API能力升级,新增支持doubao-seedance-1-5-pro模型,并新增支持通过更多入参配置来提高视频生成质量。 图片生成(Seedream 系列模型)算子:算子调用方式升级优化,提高算子调用的操作体验。 详情请参见算子库发布记录 。
OpenAPI
新增支持数据面 OpenAPI:对话(Chat)API,您可以便捷地调用LAS API,详情请参见 对话(Chat)API 。
2026年01月22日
发版版本:LAS AI 0.11.2版本。
功能模块
功能说明
发布地域
算子广场
视频内容理解(豆包系列)增强版算子新增支持:doubao-seed-1.8 模型。 详情请参见算子库发布记录 。
2026年01月15日
发版版本:LAS AI 0.11.1版本。
功能模块
功能说明
发布地域
算子广场
新增发布离线算子4个(PPT文件转换、图片人脸模糊、图片人脸检测、视频人脸模糊),在线算子5个(图片生成(Seedream 系列模型)、音频格式转换、PDF文档解析(豆包)、语音转文字(豆包系列)、音频切分)。 算子新增支持以下模型**:**doubao-seed-1.8、doubao-seedream-4.5、doubao-seedream-4.0、Deepseek-V3.2 详情请参见算子库发布记录 。
数据处理
在开发机、任务中配置环境变量时,新增支持文本模式的变量配置方式。
如上图所示:
您可以按照 key:value 的格式,在文本框中直接输入环境变量名和变量取值。 支持输入多个环境变量,通过换行分隔多个环境变量。 数据集
增强了LAS AI的数据集和数据湖-Catalog的功能协同性,提高元数据管理和元数据的一致性。细分功能点包括:
创建Lance、Iceberg格式的数据集时,支持同步将数据集相关元数据注册为Catalog中的一张表,便于用户在Catalog进行元数据管理和存储优化。说明
进行此操作时,您需具备在对应Catalog中创建表的操作权限。 后续如果您删除了对应的数据集,则对应Catalog中同步注册的表也会同步删除。 支持在元数据页面中,直接基于Lance、Iceberg表创建数据集,创建好数据集后,后续如果在Catalog中删除对应表,也会同步删除对应数据集。 将数据集和Catalog联动后,后续数据集和Catalog表中的元数据均从TOS中同步,保障了元数据的一致性、同步性。 资源管理
修改资源预留策略,当前版本将资源预留策略修改为:预留 CU = Min(4CU,15%*CU),即,预留CU数改为:4CU 与 15%*队列CU 取小值。
更多关于资源预留的说明请参见队列预留资源策略 。
2026年01月08日
发布版本:LAS AI 0.11.0版本。
功能模块
功能说明
发布地域
算子广场
新增发布离线算子17个(视频音频检测、视频安全性检测、图片Hash等),并优化升级了多个算子能力,详情请参见算子库发布记录 。
LAS Agent
首次发布LAS Agent,LAS 数据处理 Agent 是面向企业开发团队的 AI 助手,通过自然语言对话,自动搭建端到端的数据处理链路并生成运行代码 ,灵活调用 100+ AI 算子,融合豆包、DeepSeek 等大模型能力,支持工具调用、代码诊断、数据探查等,帮助企业告别繁琐的数据开发工作,更轻松、更快速地获得高质量数据 ,加速模型训练、应用落地。
当前 LAS 数据处理 Agent 为Beta版,暂不收费,完成企业认证的火山引擎账号在开通 AI 数据湖服务后,均可使用,当前为每个新用户默认提供 500W Tokens 的用量,您可直接进行试用。 当前 LAS 数据处理 Agent 仅上线华北2(北京)地域。 详情请参见LAS 数据处理 Agent 。
资源管理
优化升级了 AI 数据湖服务的队列资源应用策略,当前版本开始,您可以使用已创建好的EMR serverless队列资源作为 AI 数据湖服务的“独占队列”(推荐此种方式),灵活应用于开发机创建和任务运行,进一步提高队列资源的使用灵活度和利用率。
如下图所示,以创建开发机为例,您可选用EMR serverless队列作为“独占队列”。
优化后:
后续不再区分“通用队列”与“计算队列”资源,AI 数据湖的资源将统一为“计算队列”,EMR Serverless队列为“独占队列”,在 AI 数据湖页面直接创建的队列标识为“计算队列”。 此前已购买的计算/通用队列资源可继续使用,应用方式与优化后的方式一致,均可应用于开发机或任务调度场景中,但后续历史的队列资源将不再进行新功能演进,建议您后续使用优化后的EMR Serverless 队列。 更多关于队列资源的介绍和使用说明请参见队列管理 。
算子服务
首次发布算子服务功能页面,为您提供了多时间粒度下,在线算子的Token速率、请求错误量等监控指标,并为您提供了全局算子使用的运维监控页面。
当前算子服务仅支持以下地域:华北2(北京)、华东2(上海)。 当前算子服务支持监控的为在线算子,暂不支持离线算子。 当前支持查看最多最近30天的监控指标数据。 更多算子服务的功能详情请参见算子服务 。
数据处理
开发机页面新增支持通过复制功能来快速创建一个与已有开发机相同配置的开发机。
任务实例页面新增支持基于运行人进行实例筛选,并支持对任务实例进行“重试”操作。
工作流页面中,新增支持对单个任务设置任务的环境变量能力。
Daft引擎能力升级,新增Daft checkpoint功能,在批量数据写入的生产环境中,实现“断点续算”和“增量追加”,利用上次写入的结果进行去重,过滤掉不必要的计算。
详情请参见断点续算与增量计算:Daft Checkpoint 。
数据集
数据集能力升级优化:
支持的数据格式扩展:数据集支持的数据格式扩展,新增支持Lerobot格式数据。注意
当前Lerobot数据格式功能默认关闭,如果您希望使用此数据格式,可联系技术支持人员,申请开通功能白名单,开通后才可创建此格式的数据集。
优化数据集路径解析策略:
新增数据集时,数据来源的路径解析策略与TOS的路径解析策略保持一致。 对于csv\jsonl\parquet格式数据集,后续进行SQL数据查询时,新增支持查询数据来源路径下更深层级的数据,此前仅支持查询数据来源路径下的一级数据文件。 Lance类的数据集,新增支持预览图片/视频等数据能力。 数据集页面操作体验优化:
查找数据集的筛选条件优化,新增支持通过创建时间进行筛选。 其他:优化了一些界面操作提示文案和交互体验。 湖管理
新增支持基于Lance、Iceberg表创建数据集能力。 操作体验优化,您可以直接创建Catalog而无需关注数据类型,在后续创建表时区分Hive、Iceberg、Paimon、Lance表格式。
创建Catalog 创建数据表 增强了对Lance格式的支持,当 Lance 表发生变化(如新增/修改字段)时,支持用户在数据湖-元数据获取lance表的字段更新。
最近更新时间:2026.04.08 19:05:39