超大数据规模 - 易扩展,容错率高## HDFS 在字节跳动的发展字节跳动已经应用 HDFS 非常长的时间了。经历了 9 年的发展,目前已直接支持了十多种数据平台,间接支持了上百种业务发展。从集群规模和数据量来说,HDFS 平台在公司内部已经成长为总数十万台级别服务器的大平台,支持了 10 EB 级别的数据量。**当前在字节跳动,** **HDFS** **承载的主要业务如下:**- Hive,HBase,日志服务,Kafka 数据存储 - Yarn,Flink 的计...
> **火山引擎存储&数据库产品解决方案团队**,由资深的存储&数据库解决方案架构师组成。团队致力于帮助企业与组织更好的使用火山引擎云存储与云数据库产品,针对实际业务场景设计最优的解决方案,用专业技术助力组织和企业实现业务成功。## 为什么要做数据库选型### 数据库选型的重要性与难点发展数字经济是当下各行各业的重要方向。支撑数字经济的底座是软件,特别是基础软件,可以说基础软件是整个数字经济的坚实底座。在基础软...
它提供了一个成熟的企业级SQL on HBase解决方案。Trafodion的主要设计思想是处理operational类型的工作负载,或者是传统的OLTP应用。2006年,NonStop SQL的OLAP分支Neoview诞生,而Trafodion直接继承于Neoview和其后续产品SeaQuest。SeaQuest将Neoview从其专有的硬件,和专有的NonStop OS操作系统中移植到通用的x86服务器和通用的Linux操作系统上。2014年,乘着大数据的浪潮,SeaQuest将底层的数据存储和访问引擎移植到HBase/Hadoop上,...
数据通过 Kafka 流入不同的系统。对于离线链路,数据通常流入到 Spark/Hive 中进行计算,结果通过 ETL 导入到 HBase/ES/ClickHouse 等系统提供在线的查询服务。对于实时链路, 数据会直接进入到 HBase/ES 提供高并发低时延的在线查询服务,另一方面数据会流入到 ClickHouse/Druid 提供在线的查询聚合服务。这带来的问题就像引言中所说,数据被冗余存储了多份,导致了很多一致性问题,也造成了大量的资源浪费。为了解决这个问题,我们设计...
为提高存储效率,降低存储成本,表格数据库 HBase 版提供字典压缩功能。本文介绍如何开启字典压缩功能。 功能介绍字典压缩(ZSTD_DICT)是 HBase 深度优化的压缩算法,在 ZSTD 压缩算法的基础上进行了字典采样的优化,能够进一步压缩存储空间,数据压缩比可高达 10:1 以上。经实际测试,当开启字典压缩功能后,数据量明显减少,不同压缩算法的对比结果如下: 车联网数据 数据类型 原始数据 ZSTD 字典压缩 Snappy LZ4 车联网数据 9.7GB 722MB...
本文介绍表格数据库 HBase 版的实例规格和性能。 计算规格说明 表格数据库 HBase 版计算规格包括 Master 和 Region Server 节点的规格。 仅 Master 节点支持 2 核 4GiB(hbase.x1.medium)规格。 仅 Region Server 节点支持 32 核 64GiB(hbase.x1.8xlarge) 规格。 规格编码 CPU 内存 hbase.x1.medium 2 核 4GiB hbase.x1.large 4 核 8GiB hbase.x2.large 4 核 16GiB hbase.x1.2xlarge 8 核 16GiB hbase.x2.2xlarge 8 核 32GiB hba...
您可以根据业务量变动,灵活变更 HBase 实例的配置,包括水平扩容(即增加节点数)和垂直扩缩容(即升降节点规格)。 变配方案HBase 实例支持变更的配置项如下表。 变更类型 变更说明 变更影响 升配 Master 支持升级节... 存储空间上限为 20000GiB,步长为 10GiB。您可以提交工单联系技术支持提高上限。 无 容量型存储空间 支持扩容容量型存储空间。 说明 为实例选购了容量型存储后,才可以进行配置,容量型存储可作为冷数据使用,详情...
false:不开通容量型存储。 说明 容量型存储的详细介绍,请参见冷热分离介绍。 ColdStorage Integer 否 800 设置容量型存储空间大小,取值范围:800GiB~1,000,000GiB,步长为 10GiB。 说明 当 EnableCloudStorage 取值为 true 时,该参数必填。 ChargeType String 是 PostPaid 实例计费类型。取值: PostPaid:按量计费。 PrePaid:包年包月。 EngineVersion String 是 HBase_2.0 HBase 数据库引擎版本。当前仅支持 HBase 2...
存储空间大小。 ClientToken String 否 WbiAlPqJM6tMoSOYhT**** 用于保证请求的幂等性,防止重复提交请求。由客户端生成该参数值,要保证在不同请求间唯一,大小写敏感且不超过 127 个 ASCII 字符。 返回数据名称 类型 示例值 描述 InstanceId String hb-cnglda9068d1**** 实例 ID。 OrderNo String Order716536966356027**** 订单编号。 请求示例json POST https://hbase.volcengineapi.com/?Action=ModifyDBInstanceStorageCapa...
火山引擎表格数据库 HBase 版是基于 Apache HBase 提供的全托管 NoSQL 服务,兼容标准 HBase 访问协议,具备低成本存储、高扩展吞吐等优势。 产品架构 如上图所示,表格数据库 HBase 版主要由 Master、RegionServer、ZooKeeper、HDFS 四部分组成: Master:Master 负责管理和协调 RegionServer,以及管理表的增删改查操作。每个 HBase 实例默认只能创建 2 个 Master 节点(主备)。 RegionServer:RegionServer 负责存放和管理 HRegion,以...
本文介绍表格数据库 HBase 版实例中监控告警支持的指标项及相关说明。 注意事项云监控默认每 30 秒 获取一次数据,但会根据查看监控数据时选择的查询时间范围,将获取的数据根据不同的周期和方式进行聚合展示,具体规... 使用情况 B 实例存储空间(热存)的实时使用量。 存储(热存)水位 % 实例已使用热存空间与总热存空间的实时百分比。 Thrift 请求平均响应时间 μs 实例服务端接收到 Thrift 请求到响应的平均时间。 Thrift 请求最大响...
创建实例是开启使用表格数据库 HBase 版的第一步。本文介绍如何创建 HBase 实例。 前提条件已注册火山引擎账号,并完成实名认证。账号注册和实名认证的操作步骤,请参见如何进行账号注册和实名认证。 已创建私有网络... 适用于需要长期存储大量数据以及对性价比要求较高的场景。 SSD盘:SSD 盘读写速度快、时延低、稳定性高,适用于需要频繁读写以及对稳定性要求较高的场景。 存储空间 选择实例的存储空间。取值范围:100GiB~20,000GiB...
存储空间大小,单位 GiB。 CreateTime String 2022-11-07T07:17:55Z 实例创建时间(UTC 时间)。 DBInstanceEndpoint Array of DBInstanceEndpointObject 请参见返回示例。 连接地址信息列表。更多详情,请参见数据结构。 DeletionProtection String enabled 实例删除保护功能开关状态。取值范围: enabled:已开启。 disabled:未开启。 说明 关于实例删除保护的更多信息,请参见实例删除保护。 EngineVersion String HBase_2.0 HB...