You need to enable JavaScript to run this app.
文档中心
AI 数据湖服务

AI 数据湖服务

复制全文
下载 pdf
算子总览
LAS 智能数据处理算子
复制全文
下载 pdf
LAS 智能数据处理算子

LAS 为您提供丰富的智能数据处理算子,包括基于火山引擎方舟模型的视频理解、文本生成、图像生成等算子,同时为您提供了经过 LAS 提供的模型能力增强的音视频文档等多模态数据处理算子,以满足场景更复杂、结果质量要求更高、调用更便捷的数据处理场景。

说明

如果您是一个全新的火山引擎用户,此前未开通过 LAS 产品,您可先开通 LAS,不使用 LAS 的计费功能仅开通 LAS 产品不会产生费用。开通操作请参见准备工作;LAS 的计费服务及计费说明请参见计费说明

支持的算子列表

LAS 为您提供了“在线”、“离线”两种算子算子,覆盖音视频、文档等多种多模态数据处理场景。
Image

对比项

在线算子

离线算子

支持的算子列表

支持的算子列表:在线算子

支持的算子列表:离线算子

调用方式

支持通过 OpenAPI 方式进行公网调用,也支持在 LAS 开发机或任务管理中,基于 daft 框架进行调用。

仅支持在 LAS 开发机或任务管理中,基于daft框架进行调用。

适用场景

基于 OpenAPI 的灵活调用场景

需要批量对多模态数据进行处理的场景

版本记录

算子库发布记录

算子费用说明

功能模块

计费项

计费简介

算子广场 & 算子服务

  • 方舟模型
    使用 LAS 进行数据处理时,部分算子能力是基于方舟模型,使用此类算子时,会基于使用的方舟模型类型收取模型费用。
  • 计费方式:“按量付费”,根据使用的模型类型进行计费。

详情请参见大模型调用计费

  • 自研模型、模型增强
    部分算子的模型为 LAS 自研模型,或者基于一些模型进行了能力增强,使用此类算子时,会基于使用算子关联的模型类型收取模型费用。
  • 计费方式:”按量付费“,根据使用的模型类型进行计费。

详情请参见大模型调用计费

体验算子能力

LAS 为您提供了“在线体验”的能力,并为您提供了一定的免费体验额度,您无需任何配置,即可在在线体验入口中对示例的文档、音视频等文件进行快速处理,体验 LAS 为您提供的多模态数据处理效果。

注意

当前 LAS 为您提供了一定的免费体验额度,超出部分会依据算子的计费项进行计费。

在线体验入口

登录 LAS 控制台 后,在算子广场页面,您可以查看对应算子的卡片信息,其中在线算子支持快速体验,您可单击对应卡片中的“在线体验”入口,便捷地体验对应算子的多模态数据处理能力。
Image

在线体验操作演示

以下为一个使用在线体验功能体验 LAS 算子能力的操作示例。

  • LAS 为您提供了多个示例视频文件,您也可以删除示例文件,手动上传。
  • 在线体验时,可灵活设置算子的处理参数。

LAS 支持在线体验的各类算子可免费体验的额度限制如下,您在试用时请关注用量,避免超限计费。

算子

免费体验额度

超限计费

视频内容理解(豆包系列)增强版

50万 token

  • 在线体验时,如果超出免费额度,超出部分会依据算子的计费项进行计费。
  • 各算子的计费项及计费逻辑请参见大模型调用计费

PDF 文档解析(豆包)

50 页

语音转文字(豆包语音ASR)

5 分钟

语音转文字(Doubao-录音文件识别)增强版

5 分钟

图文 embedding(豆包系列模型)

50万 token

快速入门

除了使用在线体验功能外,您可通过简单的接口调用快速发起一个数据处理的请求,了解在线算子的使用流程。您可参考下文的流程,完成准备工作后,由浅入深的进行操作实践,了解不同场景下的操作流程与要点。

准备工作

  • 使用 LAS 算子进行数据处理时,您需要生成 API Key 用于算子调用的鉴权。同时因为 API Key 信息较为敏感,泄露 API Key 会导致您的模型用量被其他人花费,造成一定的损失,因此获取 API Key 后建议将 API Key 配置为环境变量的,方便您合理安全地使用API Key。详情请参见:获取 API Key 并配置
  • 调用在线算子时,您需要先根据您当前使用的LAS服务所在地域,了解算子调用的BaseURL,用于配置算子调用路径参数取值。详情请参见:获取 Base URL

上手实践

  • 您可通过简单的接口调用快速发起一个数据处理的请求,了解 LAS 的数据处理算子的接口调用方式、参数设置要点等,详情可参见:快速体验
  • 同时 LAS 也为您提供了图片和视频场景下的数据处理场景实践,为您示例在多模态数据处理场景下的常用架构思路、调试代码、批量设置任务等端到端的操作实践,详情可参见:

相关功能

LAS 多模态数据处理 skills

基于 LAS 丰富的数据处理算子,LAS 也为您提供了更加便捷的多模态数据处理skills,您可以在 OpenClaw、IDE工具等场景下便捷地安装与使用 LAS skills,对音视频、文档等多模态数据进行处理,当前支持的 LAS 官方 skills 请参见:LAS 官方 skills 列表

数据集 & Lance

  • LAS 为您提供了面向多模态数据的数据湖的数据集功能,支持对多模态数据进行更高效、经济的数据版本管理、数据共享等能力,详情可参见数据集管理
  • Lance 是一种专为大规模 AI 数据集设计的现代化列式数据格式。它类似于 Parquet,但针对多模态数据(如图像、视频、音频、点云及传统表格数据)的存储和访问进行了深度优化。Lance 支持与 POSIX 兼容的Linux文件系统以及主流云对象存储(火山引擎 TOS),使其成为构建统一 AI 数据湖的理想基础。LAS 数据集支持创建 Lance 格式的数据集,并支持将其他类型的数据集快速转为 Lance 数据集,实现便捷地数据入湖,详情请参见:应用实践:基于veDaft的数据集使用说明

开发机 & VeDaft

LAS 开发机为算法开发者量身打造的专业开发环境,具备高效便捷的特性,开发者可借助其快速开启数据处理任务的编写、调试及运行流程。

  • 在资源支持层面,开发机提供灵活的计算资源配置,涵盖 CPU 与 GPU,能够满足不同复杂度任务的算力需求。同时,它支持 TOS、vePFS 等存储系统的挂载,为数据存储与读取提供稳定支撑。
  • 开发环境方面,开发机预先集成了丰富的开源镜像,包括 Daft、Ray、Spark 等,大幅减少了环境搭建的时间成本。此外,还配备了持久化云盘存储服务,专门用于存储开发过程中的数据,确保数据的安全性与可追溯性。

这种一体化的设计实现了真正的“开箱即用”开发模式,有效提升了开发效率,让算法开发者能够将更多精力聚焦于核心的数据处理与算法优化工作。更多介绍请参见:开发机概述

Chat API & Responses API

LAS 也为您提供了通用的数据面 OpenAPI,包括 Chat API 和 Responses API,您也可以通过调用通用的 OpenAPI 来调用模型能力进行数据处理。详情可参见:对话(Chat)API创建模型响应

最近更新时间:2026.04.08 18:31:51
这个页面对您有帮助吗?
有用
有用
无用
无用