**“Krypton 源于 DC 宇宙中的氪星,它是超人的故乡,以氪元素命名 ”。**# 引言近些年, 在复杂的分析需求之外,字节内部的业务对于实时数据的在线服务能力也提出了更高的要求。大部分业务不得不采用多套系统来应... 数据通常流入到 Spark/Hive 中进行计算,结果通过 ETL 导入到 HBase/ES/ClickHouse 等系统提供在线的查询服务。对于实时链路, 数据会直接进入到 HBase/ES 提供高并发低时延的在线查询服务,另一方面数据会流入到 Cli...
字节内部的业务对于实时数据的在线服务能力也提出了更高的要求。大部分业务不得不采用多套系统来应对不同的 Workload,虽然能满足需求,但也带来了不同系统数据一致性的问题,多个系统之间的 ETL 也浪费了大量的资源,... 数据通常流入到 Spark/Hive 中进行计算,结果通过 ETL 导入到 HBase/ES/ClickHouse 等系统提供在线的查询服务。对于实时链路, 数据会直接进入到 HBase/ES 提供高并发低时延的在线查询服务,另一方面数据会流入到 Cli...
## 一、实时数仓建设背景### 1. 实时需求日趋迫切目前各大公司的产品需求和内部决策对于数据实时性的要求越来越迫切,需要实时数仓的能力来赋能。传统离线数仓的数据时效性是 T+1,调度频率以天为单位,无法支撑实... Hbase、fusion(滴滴自研 KV 存储) 三种存储引擎,对于维表数据比较少的情况可以使用 MySQL,对于单条数据大小比较小,查询 QPS 比较高的情况,可以使用 fusion 存储,降低机器内存资源占用,对于数据量比较大,对维表数据...
保证数据强一致性**。业界常见的关系型数据库又分商业数据库与开源数据库,其中主流的商业关系型数据库代表有 Oracle、SQL Server、DB2 等;主流的开源关系型数据库代表有 MySQL、PostgreSQL、MariaDB 等。**NoSQL**,Not Only SQL,"不仅仅是 SQL",广泛应用于以互联网业务为代表的场景。NoSQL 数据库又可以**细分为 KV 型 NoSQL 数据库(以 Redis 为代表)、文档型 NoSQL 数据库(以 MongoDB 为代表)、宽列型 NoSQL 数据库(以 HBase ...
表格数据库 HBase 版默认提供了 ZK 连接地址,同时也支持 Thrift 多语言访问,Thrift 是 HBase 标准版实例中的一种服务组件,基于 Apache Thrift(多语言支持的通信框架)开发。本文介绍基于 Python 程序通过 Thrift2 地址访问 HBase 实例的操作步骤。 前提条件如需通过私网地址访问 HBase 实例,需同时满足如下要求:已购 ECS 服务器与 HBase 实例在相同私有网络 VPC 下。ECS 服务器的购买方法,请参见购买云服务器。 已将 ECS 服务器的...
本文介绍如何使用 HBase Shell 工具连接 HBase 实例。 前提条件如需通过私网地址访问 HBase 实例,需同时满足如下要求:已购 ECS 服务器与 HBase 实例在相同私有网络 VPC 下。ECS 服务器的购买方法,请参见购买云服务... 您需要为实例创建数据库账号,详情请参见创建账号。 未开启登录认证获取 HBase 实例的 ZK 连接地址。具体操作步骤,请参见查看连接地址。 下载 HBase Shell 工具包。 说明 根据步骤 1 的方法进入目标 HBase 实例的连...
本文介绍如何使用 HBase Shell 工具连接 HBase 实例。 前提条件如需通过私网地址访问 HBase 实例,需同时满足如下要求:已购 ECS 服务器与 HBase 实例在相同私有网络 VPC 下。ECS 服务器的购买方法,请参见购买云服务... 您需要为实例创建数据库账号,详情请参见创建账号。 未开启登录认证获取 HBase 实例的 ZK 连接地址。具体操作步骤,请参见查看连接地址。 下载 HBase Shell 工具包。 说明 根据步骤 1 的方法进入目标 HBase 实例的连...
创建实例是开启使用表格数据库 HBase 版的第一步。本文介绍如何创建 HBase 实例。 前提条件已注册火山引擎账号,并完成实名认证。账号注册和实名认证的操作步骤,请参见如何进行账号注册和实名认证。 已创建私有网络... 名称需同时满足如下要求: 不能以数字、中划线(-)开头。 只能包含中文、字母、数字、下划线(_)和中划线(-)。 长度需要在 1~128 个字符内。 实例类型 当前仅支持标准版,无需选择。 数据库版本 当前仅支持HBase 2.0,...
创建实例是开启使用表格数据库 HBase 版的第一步。本文介绍如何创建 HBase 实例。 前提条件已注册火山引擎账号,并完成实名认证。账号注册和实名认证的操作步骤,请参见如何进行账号注册和实名认证。 已创建私有网络... 名称需同时满足如下要求: 不能以数字、中划线(-)开头。 只能包含中文、字母、数字、下划线(_)和中划线(-)。 长度需要在 1~128 个字符内。 实例类型 当前仅支持标准版,无需选择。 数据库版本 当前仅支持HBase 2.0,...
表示数据全部存储在冷存储中。 取值为 -1,表示关闭冷热分离。 注意 修改冷热分离时间分界点或取消冷热分离后,需要等待系统下一次执行完 compaction 后(周期为 3.5 天~10.5 天内的随机数),数据才能按照新的冷热分离分界进行迁移。如果想要数据立即进行迁移,您可以在 HBase 命令行中执行 major_compact 'tableName' 或 major_compact 'regionName'。关于 major_compact 命令的更多用法,可执行 help "major_compact" 查看详情。 ...
本文汇总表格数据库 HBase 版的 API 接口中使用的数据结构定义详情。 AllowListObject白名单信息。被 DescribeAllowLists 接口引用。 名称 类型 示例值 描述 AllowListDesc String test 白名单的备注。 AllowListI... 数据中表示当前实例所绑定标签的标签值。 在 CreateDBInstance 和 AddTagsToResource 请求参数中表示需要绑定标签所对应的标签值。 在 DescribeDBInstances 的请求参数中表示用于查询筛选的标签值。 说明 若该参数...
**“Krypton 源于 DC 宇宙中的氪星,它是超人的故乡,以氪元素命名 ”。**# 引言近些年, 在复杂的分析需求之外,字节内部的业务对于实时数据的在线服务能力也提出了更高的要求。大部分业务不得不采用多套系统来应... 数据通常流入到 Spark/Hive 中进行计算,结果通过 ETL 导入到 HBase/ES/ClickHouse 等系统提供在线的查询服务。对于实时链路, 数据会直接进入到 HBase/ES 提供高并发低时延的在线查询服务,另一方面数据会流入到 Cli...
字节内部的业务对于实时数据的在线服务能力也提出了更高的要求。大部分业务不得不采用多套系统来应对不同的 Workload,虽然能满足需求,但也带来了不同系统数据一致性的问题,多个系统之间的 ETL 也浪费了大量的资源,... 数据通常流入到 Spark/Hive 中进行计算,结果通过 ETL 导入到 HBase/ES/ClickHouse 等系统提供在线的查询服务。对于实时链路, 数据会直接进入到 HBase/ES 提供高并发低时延的在线查询服务,另一方面数据会流入到 Cli...