We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们
文档
备案
控制台
登录
立即注册
AI 数据湖服务 LAS
大模型时代的数据底座
多模态数据处理 | 异构算力混合调用 | 丰富AI算子服务 | 高效数据管理
多模态数据处理 | 异构算力混合调用 | 丰富AI算子服务 | 高效数据管理
立即咨询
立即开通
前往控制台
白皮书
免费领取
帮助企业快速构建 AI 数据底座
AI 体验中心
HOT
即刻体验 AI 数据处理能力
帮助文档
快速了解产品使用方法
VeDI 学习中心
手把手教你用好数据产品
产品功能
视频展示
产品优势
架构层级
产品架构
应用场景
产品规格
客户案例
产品动态
更开放、更低本、更高性能
的 AI 数据湖
更开放、更低本、更高性能
的 AI 数据湖
更开放、更低本、更高性能
的 AI 数据湖
更开放、更低本、更高性能
的 AI 数据湖
多模态存储
文本/图像/音视频等入湖存储,深度优化新一代湖格式Lance、Iceberg
数据集管理
提供AI场景的数据集管理能力,包含数据查询、数据编辑、版本管理等
数据处理算子
提供AI工作流编排能力,内置数百个多模态数据处理算子、自定义算子
数据处理 Agent
通过自然语言对话,自动搭建端到端的数据处理链路并生成运行代码
多模态数据处理
深度优化Ray、PySpark分布式引擎,支持CPU、GPU异构资源混合调度
调用豆包&DeepSeek
产品内支持基于豆包家族、DeepSeek等模型进行多模态数据处理
在线服务
提供开源模型、用户自定义镜像的Serving功能,支持服务灵活部署
对接 AI 生态
无缝对接火山方舟、机器学习平台等,支持训练、微调、蒸馏等场景
多模态存储
文本/图像/音视频等入湖存储,深度优化新一代湖格式Lance、Iceberg
数据集管理
提供AI场景的数据集管理能力,包含数据查询、数据编辑、版本管理等
数据处理算子
提供AI工作流编排能力,内置数百个多模态数据处理算子、自定义算子
数据处理 Agent
通过自然语言对话,自动搭建端到端的数据处理链路并生成运行代码
多模态数据处理
深度优化Ray、PySpark分布式引擎,支持CPU、GPU异构资源混合调度
调用豆包&DeepSeek
产品内支持基于豆包家族、DeepSeek等模型进行多模态数据处理
在线服务
提供开源模型、用户自定义镜像的Serving功能,支持服务灵活部署
对接 AI 生态
无缝对接火山方舟、机器学习平台等,支持训练、微调、蒸馏等场景
多模态存储
文本/图像/音视频等入湖存储,深度优化新一代湖格式Lance、Iceberg
数据集管理
提供AI场景的数据集管理能力,包含数据查询、数据编辑、版本管理等
数据处理算子
提供AI工作流编排能力,内置数百个多模态数据处理算子、自定义算子
数据处理 Agent
通过自然语言对话,自动搭建端到端的数据处理链路并生成运行代码
多模态数据处理
深度优化Ray、PySpark分布式引擎,支持CPU、GPU异构资源混合调度
调用豆包&DeepSeek
产品内支持基于豆包家族、DeepSeek等模型进行多模态数据处理
在线服务
提供开源模型、用户自定义镜像的Serving功能,支持服务灵活部署
对接 AI 生态
无缝对接火山方舟、机器学习平台等,支持训练、微调、蒸馏等场景
多模态存储
文本/图像/音视频等入湖存储,深度优化新一代湖格式Lance、Iceberg
数据集管理
提供AI场景的数据集管理能力,包含数据查询、数据编辑、版本管理等
数据处理算子
提供AI工作流编排能力,内置数百个多模态数据处理算子、自定义算子
数据处理 Agent
通过自然语言对话,自动搭建端到端的数据处理链路并生成运行代码
多模态数据处理
深度优化Ray、PySpark分布式引擎,支持CPU、GPU异构资源混合调度
调用豆包&DeepSeek
产品内支持基于豆包家族、DeepSeek等模型进行多模态数据处理
在线服务
提供开源模型、用户自定义镜像的Serving功能,支持服务灵活部署
对接 AI 生态
无缝对接火山方舟、机器学习平台等,支持训练、微调、蒸馏等场景
打破数据壁垒,加速企业 AI 落地
打破数据壁垒,加速企业 AI 落地
打破数据壁垒,加速企业 AI 落地
打破数据壁垒,加速企业 AI 落地
为什么选择多模态数据湖?
为什么选择多模态数据湖?
为什么选择多模态数据湖?
为什么选择多模态数据湖?
AI 新基建
新一代 AI 数据湖
支持多种主流的 AI 计算框架
专为 AI 设计的数据集管理
无缝对接多个 AI 训练平台
低成本
算力成本&上手门槛
直接调用最新DeepSeek和豆包
享受火山模型训练资源福利
可视化界面,一键启停模型微调
强安全
资源隔离&数据管控
资源隔离严格,数据互不干扰
多种数据加密机制,数据安全
企业级数据权限管控,数据可控
高效率
应用场景&模型训练
支持方舟所有模型,多样场景
降低模型体量,提升训练效率
列式存储,任务执行速度更快
AI 新基建
新一代 AI 数据湖
支持多种主流的 AI 计算框架
专为 AI 设计的数据集管理
无缝对接多个 AI 训练平台
低成本
算力成本&上手门槛
直接调用最新DeepSeek和豆包
享受火山模型训练资源福利
可视化界面,一键启停模型微调
强安全
资源隔离&数据管控
资源隔离严格,数据互不干扰
多种数据加密机制,数据安全
企业级数据权限管控,数据可控
高效率
应用场景&模型训练
支持方舟所有模型,多样场景
降低模型体量,提升训练效率
列式存储,任务执行速度更快
AI 新基建
新一代 AI 数据湖
支持多种主流的 AI 计算框架
专为 AI 设计的数据集管理
无缝对接多个 AI 训练平台
低成本
算力成本&上手门槛
直接调用最新DeepSeek和豆包
享受火山模型训练资源福利
可视化界面,一键启停模型微调
强安全
资源隔离&数据管控
资源隔离严格,数据互不干扰
多种数据加密机制,数据安全
企业级数据权限管控,数据可控
高效率
应用场景&模型训练
支持方舟所有模型,多样场景
降低模型体量,提升训练效率
列式存储,任务执行速度更快
AI 新基建
专业算法团队提供业务诊断、训练优化、问题解答等服务,让企业AI应用轻松落地
低成本
专业算法团队提供业务诊断、训练优化、问题解答等服务,让企业AI应用轻松落地
强安全
专业算法团队提供业务诊断、训练优化、问题解答等服务,让企业AI应用轻松落地
高效率
专业算法团队提供业务诊断、训练优化、问题解答等服务,让企业AI应用轻松落地
开放的架构设计
分布式存储 × 拥抱 AI 算力 × 弹性计算资源
提供工程化的数据处理解决方案
丰富的应用场景,加速 AI 落地,实现价值提升
提供工程化的数据处理解决方案
丰富的应用场景,加速 AI 落地,实现价值提升
提供工程化的数据处理解决方案
丰富的应用场景,加速 AI 落地,实现价值提升
提供工程化的数据处理解决方案
丰富的应用场景,加速 AI 落地,实现价值提升
智驾网联场景
具身智能场景
模型训练场景
AI 媒资库建设
音视频数据挖掘
文本清洗与翻译
智驾网联场景
车企多品牌布局中,智能网联场景面临技术挑战,火山引擎多模态方案通过 EMR Ray 优化计算、LAS 提升处理效率、Lance 降低存储成本,最终实现降本增效。
任务效率提升 7 倍:
CPU+GPU 混合调度,分布式处理提效
存储成本降低至 1/4:
LAS Lance 预处理,仅追加新标签列
模型训练效率提升 1.5 倍:
EMR Ray 解决 CPU 满载,加速训练
推荐算子
图文 embedding
视觉内容理解
立即咨询
智驾网联场景
车企多品牌布局中,智能网联场景面临技术挑战,火山引擎多模态方案通过 EMR Ray 优化计算、LAS 提升处理效率、Lance 降低存储成本,最终实现降本增效。
任务效率提升 7 倍:
CPU+GPU 混合调度,分布式处理提效
存储成本降低至 1/4:
LAS Lance 预处理,仅追加新标签列
模型训练效率提升 1.5 倍:
EMR Ray 解决 CPU 满载,加速训练
推荐算子
图文 embedding
视觉内容理解
立即咨询
智驾网联场景
车企多品牌布局中,智能网联场景面临技术挑战,火山引擎多模态方案通过 EMR Ray 优化计算、LAS 提升处理效率、Lance 降低存储成本,最终实现降本增效。
任务效率提升 7 倍:
CPU+GPU 混合调度,分布式处理提效
存储成本降低至 1/4:
LAS Lance 预处理,仅追加新标签列
模型训练效率提升 1.5 倍:
EMR Ray 解决 CPU 满载,加速训练
推荐算子
图文 embedding
视觉内容理解
立即咨询
智驾网联场景
车企多品牌布局中,智能网联场景面临技术挑战,火山引擎多模态方案通过 EMR Ray 优化计算、LAS 提升处理效率、Lance 降低存储成本,最终实现降本增效。
任务效率提升 7 倍:
CPU+GPU 混合调度,分布式处理提效
存储成本降低至 1/4:
LAS Lance 预处理,仅追加新标签列
模型训练效率提升 1.5 倍:
EMR Ray 解决 CPU 满载,加速训练
推荐算子
图文 embedding
视觉内容理解
立即咨询
来自客户的信任
国内知名的汽车企业,近年来专注智驾网联,把高膨胀的车端数据应用于模型训练上,面临重重挑战。火山引擎把 PB 级别数据处理从 7 天缩短到 1 天......
全球领先的游戏开发商与发行商,发布了一款 AI 语音交互的游戏,引入火山引擎多模态数据湖之前,客户数据加工效率堪忧,系统稳定较差......
全媒体传播平台,主营报刊出版、新媒体内容与广告运营,拥有数十年的内容沉淀,积累了海量文本、图片、视频等多模态媒体资产,由于缺少成熟......
专注于智能语音交互与 AI 数据服务,把客户素材转化为结构化内容,形成高质量数据集,用于 AI 模型训练。客户原先采取传统 OCR 解析,存在......
产品动态
2025年3月
上线可视化工作流,支持用户低代码搭建工作流任务;新增30+内置算子;支持模型一键部署为在线服务
查看详情
2025年4月
发布 LAS MCP Server,已上架到方舟 MCP 广场;数据集增加分类,按场景分为通用数据集和推理数据集
查看详情
2025年5月
控制台首页全新发布,用户快速上手数据集处理流程,清晰了解各产品功能;提供多场景最佳实践
查看详情
2025年6月
算子广场全新发布:提供全新的数据处理算子能力,包含文本、视频、音频、图片等数据处理场景
查看详情
2025年7月
新增支持豆包大模型1.6,更强的多模态理解能力、推理能力,包含 Doubao-Seed-1.6 等
查看详情
2025年8月
全面支持方舟大模型,包括视觉理解、多模态深度思考、文本生成、多模态 embedding 等
查看详情
2025年9月
新增数据集共享功能(白名单),支持将数据集分享;支持可视化创建 Paimon 表与 Iceberg 表
查看详情
2025年10月
上线火山 AI 体验中心,支持多模态数据处理,支持自然语言生成代码、一键试运行并可调优
查看详情
2025年11月
LAS 数据处理 Agent 邀测发布,通过自然语言问答,支持节点自动编排、代码自动生成/优化、知识检索
查看详情