You need to enable JavaScript to run this app.
导航

产品简介

最近更新时间2023.09.05 17:06:33

首次发布时间2021.09.30 14:31:53

1. LAS 是什么

湖仓一体分析服务 LAS(Lakehouse Analytics Service) 是湖仓一体架构的 Serverless 数据平台,孵化自字节跳动最佳实践,提供一站式 EB 级海量数据存储、管理、计算和交互分析能力,兼容 Spark、Presto、Hudi 生态,助力企业构建云原生智能实时湖仓,驱动业务增长。

以下是湖仓一体分析服务 LAS 产品白皮书,欢迎大家填写问卷下载:《火山引擎 湖仓一体分析服务 LAS 产品白皮书 公有云 V1.6》

alt

2. 产品功能
  • Serverless 全托管

开箱即用,0 门槛启动端到端数据分析,系统自优化、自调整,无需构建复杂集群节点、运维管理,会 SQL 就能上手,专注业务本身。

  • 统一 SQL 访问层

支持 Spark、Presto 多引擎,98% 兼容 Hive 语法,统一 SQL 访问层,智能引擎路由,选择最优引执行擎,参数自动调优,性能远超开源 2.7+ 倍。

  • 统一元数据管理

统一元数据视图,多引擎元数据管理,跨源查询分析能力,直接查询 MySQL、HBase、Kafka、对象存储等,支持元数据自动发现与采集,实时感知变化。

  • 湖仓一体架构

融合了数据湖的开放性及数据仓库的规范性,开放的存储&计算引擎,规范的存储格式及 ACID 事务层,外表映射,无需导入数据,直接访问分析数据湖,一个平台完成闭环数据链路,实现湖与仓的关联分析。

  • 批流一体存储

基于字节内部深度优化 Hudi 存储引擎,通过行列混合存储、索引、实时入湖、微批&轻载 ETL等技术,数据同时支持批流处理两种场景,支持 ACID 事务更新操作和复杂交互分析,支持增量消费&高吞吐写入。

  • 实时智能湖仓

支持元数据自动发现、推断数据 schema、自动建库建表,智能更新实时可见。物化视图自动构建、自优化、自更新,无需人工修改 SQL,分钟级写入,秒级查询性能。

  • 大规模弹性拓展

基于 VKE/VCI(增强 Kubernetes)容器的管理编排能力,自研调度器,性能提升 30%,具备超大规模存储和计算资源的极致弹性扩展能力,支持作业级弹性,自适应业务动态变化的数仓建设需求。

  • 企业级数据安全

提供企业级多租户隔离能力,数据隔离和资源隔离,行列级颗粒度的统一权限管理平台,支持大数据场景数据删除、动态脱敏、透明加密、数据分类分级等,满足隐私安全合规场景。

3. 产品优势
  • 0 门槛,开箱即用,无需运维

Serverless 云原生架构,全托管服务,免平台运维。开箱即用,无前期搭建,按量付费即刻使用,会 SQL 就能上手,帮助用户专注于业务,探寻数据最大价值。

  • 低成本,存算分离,降本增效

存储与计算分离,可独立扩展,提高资源利用率。不同热度数据分层存储、分级定价,降低存储成本。列级 TTL 和 LocalSort 让数据存得更少、更紧凑,性能提升 6 倍,帮助企业实现降本增效。

  • 多生态,兼容开源,优于开源

兼容 Spark、Presto、Hudi、Hive 等开源生态,基于字节内部深度优化,Spark、Presto 比开源提升 2.7+ 倍、2.6+ 倍,多 Spark 版本、多 Hive 功能、多 Coordinator 架构,提供容灾能力,秒级响应恢复,保障稳定性。

  • 易搬迁,平滑低本,又快又准

提供专业的迁移工具、方案和服务,历经多数客户打磨,支持数据、元数据、作业、权限等全方位搬迁,确保全过程的顺滑无感,在 Hadoop 迁移上降低至少 80% 人力投入,省时省力,又快有准,减少企业搬迁的担忧与顾虑。

  • 一站式,内置工具,开发极简

内置极简的开发工具,具备作业开发、管理及监控能力,如离线 SQL/Spark Jar 等,内置各类 UI,赋能分析师、业务用户,无缝对接各类 BI、增长营销产品,实现一站式数据挖掘-洞察-应用,驱动业务增长。

4. 应用场景

4.1 云数据仓库

企业构建云上数据仓库,解决多源异构、海量数据、批流场景下低性能、高成本问题,打破数据孤岛,减少数据移动,提供一站全域数据分析与挖掘服务。

  • 专业迁移上云: 迁移方案工具化,支持多源数据上云、搬站、同步。

  • 高效数据建设: 打通DataLeap实现集成、开发、运维治理等全套建设。

  • 丰富数仓应用: 对接内部生态,实现BI报表、OLAP分析、数据探索。

4.2 日志大数据分析

帮助企业更好地了解业务运行情况,发现问题和优化机会,从而提高运营效率和决策质量,例如:网络安全分析、应用性能分析、业务分析、市场营销分析等。

  • 提高开发效率: 统一SQL语法,智能选择最优引擎,更快的查询速度。

  • 成本极致优化: 存算分离&冷热分层的云原生湖仓架构,精准控制成本。

  • 降低运维消耗: 解决日志采集、实时和离线处理分析,无需多余运维。

4.3 隐私安全合规

帮助企业构建数据安全能力,确保企业数据“出海&入海”安全合规,业务符合 GDPR、CCPA、个人信息安全法等要求,为业务的全球化发展保驾护航。

  • 内部最佳实践: 支撑字节内部产品/服务实现全球化快速平稳发展。

  • 降低数据风险: 个人数据遗忘权,识别用户数据,分级分类打标。

  • 高效严格管控: 权限管控、脱敏规则、加密策略,防止数据泄露。

4.4 精细化运营

支持电商/金融/汽车/游戏等行业,挖掘数据资产,发挥数据价值,帮助企业提升运营效率、决策质量、精准服务、客户满意度,同时大大降低运营成本。

  • 业务数据深挖掘: 支持EB级海量数据分析,上亿DAU精细分析&运营。

  • 业务洞察高时效: 实时弹性扩展,高性能计算引擎,满足突发业务增长。

  • 业务需求快响应: 无缝对接,生态丰富,满足业务快速迭代的多样诉求。

4.5 搜索推荐

支持抖音全业务线,体量庞大,深度打磨搜广推场景,十万级CU、万级SQL,支持千人千面、精准推送、高效转化,提升用户体验,加速商品转化。

  • 极速查询: 上亿级别商品特征用户数据,秒级查询、分析、可视。

  • 实时更新: 海量数据 Upsert/Merge 行级更新,数据分钟级可见。

  • 高效开发: 统一 SQL,数据输出的交互式、个性化、高扩展性。

4.6 海量营销数据分析

某汽车企业规模MAU几十万、2000+门店,覆盖买卖租赁、保养配售等完整产业链,通过搭建标准化高效化的数据体系,打通流量,赋能智慧营销生态。

  • 多源融合: 高效整合移动端、车机端、线下门店多源异构数据。

  • 引擎强劲: 支持数万个用户标签的构建、迭代和深度挖掘。

  • 易于扩展: 平滑扩展&集成,支持AI、机器学习等创新业务发展。