We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们
文档
备案
控制台
登录
立即注册
AI 数据湖服务
LAS(Lake AI Service)
孵化于字节跳动大模型业务,帮助客户构建新一代AI数据湖,高效存储、管理和处理多模态数据(文本、图像、音视频等),无缝对接火山方舟、机器学习平台等模型产品,支持数据准备、模型微调等场景,加速AI落地。
LAS 是新一代多模态数据湖服务,提供湖存储、湖管理、湖计算三大能力。
多模态
数据类型
低成本
模型训练
强安全
数据管控
高效率
业务场景
立即咨询
前往控制台
多模态数据湖实践
AI 时代数据基座
产品定价
每月享有100万免费额度
帮助文档
快速了解产品使用方法
最佳实践
一线经验,干货分享
产品功能
产品优势
产品架构
产品规格
应用场景
客户案例
产品对比
产品动态
产品功能
多模态湖存储
支持文本/图像/音视频等入湖存储,提供深度优化的新一代湖格式Lance、Iceberg,自动合并小文件、清理碎片及过期文件等。
数据集管理
提供面向 AI 场景的数据集管理能力,包含数据查询、数据编辑、版本管理、数据洞察、数据导出等,内置分布式缓存,加速数据集访问。
统一元数据
统一管理结构化/半结构化/非结构化数据的技术元数据,支持统一权限管理,实现安全共享数据,同时保持开放性,兼容开源 Hive/Iceberg Rest API。
AI 算子处理
提供可视化的AI工作流编排,内置数百个多模态数据处理算子,支持自定义算子,满足客户个性化数据处理诉求,同时提供多种开源算法库。
多模态处理引擎
内置深度优化的Ray、PySpark分布式引擎,支持CPU、GPU异构资源混合调度,提高整体资源利用率,无缝对接已有EMR计算集群。
调用豆包&DeepSeek
产品内支持基于豆包家族模型、DeepSeek等模型进行多模态数据处理,涵盖跨模态内容理解归纳、分析标注、数据增强等高阶数据处理能力。
在线服务
提供开源模型、用户自定义镜像的Serving功能,支持服务灵活部署、动态扩缩容,具备完备的监控告警能力。
对接 AI 生态
无缝对接火山方舟、机器学习平台、向量数据库等,支撑训练/微调/蒸馏/检索等AI完整链路,一站式用好数据、用好模型。
多模态湖存储
支持文本/图像/音视频等入湖存储,提供深度优化的新一代湖格式Lance、Iceberg,自动合并小文件、清理碎片及过期文件等。
数据集管理
提供面向 AI 场景的数据集管理能力,包含数据查询、数据编辑、版本管理、数据洞察、数据导出等,内置分布式缓存,加速数据集访问。
统一元数据
统一管理结构化/半结构化/非结构化数据的技术元数据,支持统一权限管理,实现安全共享数据,同时保持开放性,兼容开源 Hive/Iceberg Rest API。
AI 算子处理
提供可视化的AI工作流编排,内置数百个多模态数据处理算子,支持自定义算子,满足客户个性化数据处理诉求,同时提供多种开源算法库。
多模态处理引擎
内置深度优化的Ray、PySpark分布式引擎,支持CPU、GPU异构资源混合调度,提高整体资源利用率,无缝对接已有EMR计算集群。
调用豆包&DeepSeek
产品内支持基于豆包家族模型、DeepSeek等模型进行多模态数据处理,涵盖跨模态内容理解归纳、分析标注、数据增强等高阶数据处理能力。
在线服务
提供开源模型、用户自定义镜像的Serving功能,支持服务灵活部署、动态扩缩容,具备完备的监控告警能力。
对接 AI 生态
无缝对接火山方舟、机器学习平台、向量数据库等,支撑训练/微调/蒸馏/检索等AI完整链路,一站式用好数据、用好模型。
展开查看更多
产品优势
AI 基建
新一代 AI 数据湖
支持多种主流的 AI 计算框架
专为 AI 设计的数据集管理
无缝对接多个 AI 训练平台
低成本
算力成本&上手门槛
直接调用DeepSeek和豆包
享受火山模型训练资源福利
可视化界面,一键启停模型微调
强安全
资源隔离&数据管控
资源隔离严格,保障数据互不干扰
多种数据加密机制,保障数据安全
企业级数据权限管控,数据可控
高效率
应用场景&模型训练
支持方舟平台所有模型,多样场景
降低模型体量,提升模型训练效率
数据列式存储,任务执行速度更快
AI 基建
新一代 AI 数据湖
支持多种主流的 AI 计算框架
专为 AI 设计的数据集管理
无缝对接多个 AI 训练平台
低成本
算力成本&上手门槛
直接调用DeepSeek和豆包
享受火山模型训练资源福利
可视化界面,一键启停模型微调
强安全
资源隔离&数据管控
资源隔离严格,保障数据互不干扰
多种数据加密机制,保障数据安全
企业级数据权限管控,数据可控
高效率
应用场景&模型训练
支持方舟平台所有模型,多样场景
降低模型体量,提升模型训练效率
数据列式存储,任务执行速度更快
产品架构
打造先进架构,引领技术跨越
应用场景
应用场景
应用场景
应用场景
多模态数据湖
AI 模型蒸馏
AI 数据预处理
多模态数据湖
企业的结构化和非结构化数据统一入湖、统一管理,打破数据孤岛,减少数据移动,降低数据使用成本,提高数据使用效率。
多模态数据统一存储:
支持表和文件统一湖格式存储、统一元数据管理
开放的湖格式:
丰富且开放的湖格式,支持在Parquet、Webdataset之间相互转换
湖 · 仓 · AI 一体化:
适配 PyTorch、TensorFlow、Ray、Spark 等主流引擎
推荐产品
E-MapReduce
对象存储 TOS
立即咨询
多模态数据湖
企业的结构化和非结构化数据统一入湖、统一管理,打破数据孤岛,减少数据移动,降低数据使用成本,提高数据使用效率。
多模态数据统一存储:
支持表和文件统一湖格式存储、统一元数据管理
开放的湖格式:
丰富且开放的湖格式,支持在Parquet、Webdataset之间相互转换
湖 · 仓 · AI 一体化:
适配 PyTorch、TensorFlow、Ray、Spark 等主流引擎
推荐产品
E-MapReduce
对象存储 TOS
立即咨询
多模态数据湖
企业的结构化和非结构化数据统一入湖、统一管理,打破数据孤岛,减少数据移动,降低数据使用成本,提高数据使用效率。
多模态数据统一存储:
支持表和文件统一湖格式存储、统一元数据管理
开放的湖格式:
丰富且开放的湖格式,支持在Parquet、Webdataset之间相互转换
湖 · 仓 · AI 一体化:
适配 PyTorch、TensorFlow、Ray、Spark 等主流引擎
推荐产品
E-MapReduce
对象存储 TOS
立即咨询
多模态数据湖
企业的结构化和非结构化数据统一入湖、统一管理,打破数据孤岛,减少数据移动,降低数据使用成本,提高数据使用效率。
多模态数据统一存储:
支持表和文件统一湖格式存储、统一元数据管理
开放的湖格式:
丰富且开放的湖格式,支持在Parquet、Webdataset之间相互转换
湖 · 仓 · AI 一体化:
适配 PyTorch、TensorFlow、Ray、Spark 等主流引擎
推荐产品
E-MapReduce
对象存储 TOS
立即咨询
产品规格
每月限量特惠
数据管理-按量付费
元数据管理
每月前100万个元数据对象免费
超过100万的部分,0.5元/万/月
每月限量
¥
0
.00
/万/月
原价:0.5元/万/月
立即咨询
计算资源-按量付费
公共队列
(企业新用户)
随时启停,无需容量规划,按实际消耗付费
CPU资源:0.35元/CU/小时
GPU资源:最低 4.55元/卡/小时
不使用不付费
¥
0
.00
/CU/月
立即咨询
推荐
计算资源-包年包月
独占队列
(成长型企业)
价格更优,多种 GPU,适合成熟业务稳定运行
CPU资源:135元/CU/月
GPU资源:最低 4480元/卡/月
专属资源
¥
135
.00
/CU/月
立即咨询
产品动态
紧跟技术发展,产品飞速迭代
2025-03-31
公测阶段
支持创建、查询、导出多模态数据集,支持统一元数据管理等。
2025-03-31
公测阶段
支持创建、查询、导出多模态数据集,支持统一元数据管理等。
一键启动火山引擎之旅
联系我们