LAS (LakeHouse Analytics Service) 全称是 **湖仓一体分析服务,**是字节数据中台底层引擎能力经过内部打磨后的商业化输出,提供多模引擎,完全兼容开源 Spark、Presto、Flink 生态,具备、海量存储、数据实时更新、统一 SQL、批流合一等优势。能够与大数据开发治理套件对接,支持数据仓库/集市/数据湖分析能力,帮助企业构建云原生实时湖仓分析平台。其核心架构如下:
LAS 支持大数据平台和上层湖仓一体分析平台的完整产品架构。其底层支持分布式文件存储,支持多种湖仓数据格式,还支持基于 YARN 的大数据集群调度,并且支持离线处理、实时计算、交互式查询、OLAP 和 AI 分析等多种计算负载能力,从而为客户提供完整的湖仓一体分析平台。从产品架构上,LAS 平台支持以下功能模块:
主机管理模块提供了对物理和虚拟主机的全面管理能力。用户可以轻松添加、删除和管理主机,查看主机状态,进行主机资源的监控。该模块确保了平台基础设施的健康和稳定运行,是大数据集群运行的基础。
集群管理模块是 LAS 平台的核心,涵盖了集群的创建、管理与维护。该模块提供以下关键功能:
服务管理模块支持对二十多种大数据基础组件的管理,确保平台的广泛兼容性与高效运行。支持的组件包括 YARN、HDFS、Spark、Presto、Flink、Zookeeper、Knox、OpenLDAP、Kerberos、Ranger、OpenSearch、Kafka、HBase、Tez、StarRocks/Doris、Hue 等。主要功能如下:
日志中心模块为用户提供了强大的日志管理与分析功能,以便及时排查故障和进行操作审计。
运维管理模块是保障集群稳定运行的关键,当前主要提供告警中心功能: