从集群规模和数据量来说,HDFS 平台在公司内部已经成长为总数十万台级别服务器的大平台,支持了 10 EB 级别的数据量。**当前在字节跳动,** **HDFS** **承载的主要业务如下:**- Hive,HBase,日志服务,Kafka 数据... 我们需要非常多的 NameNode 实现联邦机制来接入不同上层业务的数据服务。但当 NameNode 数量也变得非常多了以后,用户请求的统一接入及统一视图的管理也会有很大的问题。为了解决用户接入过于分散,我们需要一个独立...
数据通过 Kafka 流入不同的系统。对于离线链路,数据通常流入到 Spark/Hive 中进行计算,结果通过 ETL 导入到 HBase/ES/ClickHouse 等系统提供在线的查询服务。对于实时链路, 数据会直接进入到 HBase/ES 提供高并发低... Krypton 在 Plan 阶段会直接发一个 Sample Query Plan Fragment 来收集统计信息,TPCH-1T 的测试集上,Sample 数据的统计预估和支持数据的统计值只相差 1%,Sample Query 执行的 Overhead 不超过执行时长的 2%。 另外...
为业务应用打造坚实的数据库底座。### 数据库发展与类型简介数据库系统在上世纪 70 年代初出现,至今已经发展了半个多世纪,其理论、技术与产品已经非常丰富,呈现出百花齐放的景象。根据其特点可以大概分为关系型数据库管理系统(RDBMS),非关系型数据库(NoSQL),NewSQL、云原生数据库、分布式数据库等等。每一类数据库中使用不同的技术实现,又可以分化出不同的产品类型。根据 DB-Engines 的统计,数据库产品数量已经有将近 400 种,...
HBase,日志服务,Kafka 数据存储* Yarn,Flink 的计算框架平台数据* Spark,MapReduce 的计算相关数据存储**02****字节跳动特色的 HDFS 架构**在深入相关的技术细节之前,我... 我们需要非常多的 NameNode 实现联邦机制来接入不同上层业务的数据服务。但当 NameNode 数量也变得非常多了以后,用户请求的统一接入及统一视图的管理也会有很大的问题。为了解决用户接入过于分散,我们需要一个独立...
为提高实例的稳定性和安全性,表格数据库 HBase 版实例在使用过程中存在部分限制,详细信息如下所示。 约束项 使用约束 数据面 表格数据库 HBase 版默认每个 Cell 的最大数据量不能超过 10MB。 说明 Cell 指 rowKey... 变更节点规格 HBase 实例变更节点规格时,默认为平滑变更,若想要快速完成规格变更,您可以提交工单联系技术支持。快速更改规格会造成闪断,请根据实际业务进行评估。 增减节点数量 Master 节点数量固定为 2 个,且不...
本文汇总表格数据库 HBase 版提供的 API 接口。 地域和可用区API 描述 DescribeRegions 调用 DescribeRegions 接口查询表格数据库 HBase 版可用的地域资源信息。 DescribeZones 调用 DescribeZones 接口查询表格数... ModifyRSNodeCount 调用 ModifyRSNodeCount 接口修改实例的 RegionServer 节点个数。 ModifyDBInstanceStorageCapacity 调用 ModifyDBInstanceStorageCapacity 接口修改实例的存储容量。 标签管理API 描述 AddTag...
MasterSpec String 是 hbase.x1.medium Master 节点的规格码。 说明 关于 Master 节点所支持的规格信息,请参见实例规格。 Master 节点数量固定为 2,不支持增减。 RSCount Integer 是 4 RegionServer 节点... EngineVersion String 是 HBase_2.0 HBase 数据库引擎版本。当前仅支持 HBase 2.0 版本,取值默认为 HBase_2.0。 EnableAuth Bool 否 false 是否开启登录认证。取值: true:开启登录认证。实例创建成功后,您需...
创建实例是开启使用表格数据库 HBase 版的第一步。本文介绍如何创建 HBase 实例。 前提条件已注册火山引擎账号,并完成实名认证。账号注册和实名认证的操作步骤,请参见如何进行账号注册和实名认证。 已创建私有网络... 节点数量:Master 节点的数量。固定为 2,支持高可用,无需选择。 Region Server 节点,需要选择如下配置:节点规格:选择 Region Server 节点的资源规格。更多关于 Region Server 节点规格的信息,请参见实例规格。 节...
创建实例是开启使用表格数据库 HBase 版的第一步。本文介绍如何创建 HBase 实例。 前提条件已注册火山引擎账号,并完成实名认证。账号注册和实名认证的操作步骤,请参见如何进行账号注册和实名认证。 已创建私有网络... 节点数量:Master 节点的数量。固定为 2,支持高可用,无需选择。 Region Server 节点,需要选择如下配置:节点规格:选择 Region Server 节点的资源规格。更多关于 Region Server 节点规格的信息,请参见实例规格。 节...
为提高存储效率,降低存储成本,表格数据库 HBase 版提供字典压缩功能。本文介绍如何开启字典压缩功能。 功能介绍字典压缩(ZSTD_DICT)是 HBase 深度优化的压缩算法,在 ZSTD 压缩算法的基础上进行了字典采样的优化,能... 进阶设置DATA_BLOCK_COUNT_FOR_TRAINING 参数用于设置训练数据 Data Block 的数量大小,该参数为缺省配置,默认值与 Data Block 大小相关。且训练数据的大小可以决定字典的大小,训练效果直接决定了压缩效果。因此,您...
本文汇总表格数据库 HBase 版的 API 接口中使用的数据结构定义详情。 AllowListObject白名单信息。被 DescribeAllowLists 接口引用。 名称 类型 示例值 描述 AllowListDesc String test 白名单的备注。 AllowListI... 表示实例未加入任何项目。 RSCount Integer 2 RegionServer 节点的数量。 RegionId String cn-beijing 实例所属的地域 ID。 Status String Running 实例当前状态。关于实例状态的更多说明,请参见实例状态说明。 St...
本文介绍表格数据库 HBase 版相关的计费项和价格详情。 计费项当前使用表格数据库 HBase 版实例过程中,存在如下计费项。 计费项 计费方式 计算节点 按量计费(后付费)和包年包月(预付费),根据节点规格和使用时长计费... HDD 文件存储 0.0015 0.7 SSD 文件存储 0.0042 2 容量型存储 0.00020625 0.099 价格计算公式按量计费 每小时后付价格 = 计算节点费用 + 存储空间费用 =(Master 节点规格单价 × 节点个数 + Region Server 节点规...
变配方案HBase 实例支持变更的配置项如下表。 变更类型 变更说明 变更影响 升配 Master 支持升级节点规格。 不支持增加节点数量,固定 2 个节点。 升级节点过程中,实例可能会出现 1~3 分钟的断连。请谨慎操作。... 容量型存储可作为冷数据使用,详情请参见开通容量型存储。 无 降配 Master 支持降低节点规格。 不支持减少节点数量,固定 2 个节点。 降低节点规格过程中,实例可能会出现 1~3 分钟的断连。请谨慎操作。建议在业...