You need to enable JavaScript to run this app.
导航
集群类型
最近更新时间:2023.11.13 15:07:49首次发布时间:2021.09.01 17:27:34

本文介绍火山引擎 E-MapReduce(EMR) 支持的集群类型以及各集群相关的操作。

集群描述重要操作

Hadoop

  • Hadoop生态圈的基础服务组件,HDFS,YARN,MapReduce组件。

  • 提供离线数据分析,Hive、Spark、Tez。

  • 提供实时数据分析,Flink、SparkStreaming。

  • 提供交互式分析查询,Presto、Trino。

Flink

Flink 是一个面向有限流和无限流有状态计算的分布式计算框架,Flink集群提供开源消息引擎Flink服务,支持流处理和批处理两种应用类型。

Kafka

分布式、支持分区(partition)的、多副本(replica)的,基于 ZooKeeper 协调的分布式消息系统。

Pulsar

基于发布/订阅模式,且支持多租户、分布式、云原生的开源高性能消息与流平台,提供消息队列和计算服务,解决服务器间的消息传输与队列问题。

Presto

MPP 架构的开源分布式查询分析引擎,支持 PB 级数据查询分析,支持多种数据源,如 Hive, MySQL,MongoDB,Redis 等。

Trino

开源分布式 SQL 查询引擎,支持PB级别数据的交互式分析;本身不存储数据,结合云存储,天然形成存算分离的架构进行弹性数据分析。

Doris

现代化的 MPP 分析型数据库产品。亚秒级响应时间查询效率,可高效地进行实时数据分析,满足固定历史报表,实时数据分析,交互式数据分析和探索式数据分析等多种数据分析需求。

StarRocks

新一代极速全场景 MPP (Massively Parallel Processing) 数据库,采用了全面向量化引擎,让用户的数据分析变得更加简单和敏捷。

ClickHouse

分布式实时分析型列式数据库产品,它能够亚秒级响应时间即可获得查询结果,可高效地进行实时数据分析。在用户行为分析、流量和监控、用户画像、实时BI报表等业务场景有广泛的应用。

HBase

HBase集群提供的一种NoSQL数据库服务,构建在HDFS之上,提供了高并发的随机读写、实时点查。

OpenSearch

Opensearch集群是一个完全兼容开源 Elasticsearch 接口的全文检索和分析引擎,为用户提供结构化、非结构化文本的多条件检索、统计、报表等功能。

TensorFlow

端到端开源机器学习平台,助力研究人员轻松的构建模型进行机器学习生产。