从集群规模和数据量来说,HDFS 平台在公司内部已经成长为总数十万台级别服务器的大平台,支持了 10 EB 级别的数据量。**当前在字节跳动,** **HDFS** **承载的主要业务如下:**- Hive,HBase,日志服务,Kafka 数据... 当数据量跨过 10EB,集群规模扩大到十万+台的时候,慢节点问题,更细粒度服务分级问题,成本问题和元数据瓶颈进一步凸显。我们在架构上也向着包括多租户体系构建、重构数据节点和元数据分层等方向进一步演进。这些演...
SeaQuest将底层的数据存储和访问引擎移植到HBase/Hadoop上,并创新地开发出HBase分布式事务处理等新技术,从而推出了Trafodion,并将全部代码开源,贡献给社区。应客户的要求,为了能够让业务系统在国产化环境下性能达到最优,对系统从硬件到软件做了全方位的性能优化,包括BIOS、OS、DB以及应用等。# 二、优化原则性能是指操作系统完成任务时的有效性、稳定性和响应速度。Linux平台经常会遇到系统不稳定、响应速度慢等问题,操作系...
保证数据强一致性**。业界常见的关系型数据库又分商业数据库与开源数据库,其中主流的商业关系型数据库代表有 Oracle、SQL Server、DB2 等;主流的开源关系型数据库代表有 MySQL、PostgreSQL、MariaDB 等。**NoSQL**,Not Only SQL,"不仅仅是 SQL",广泛应用于以互联网业务为代表的场景。NoSQL 数据库又可以**细分为 KV 型 NoSQL 数据库(以 Redis 为代表)、文档型 NoSQL 数据库(以 MongoDB 为代表)、宽列型 NoSQL 数据库(以 HBase ...
数据通常流入到 Spark/Hive 中进行计算,结果通过 ETL 导入到 HBase/ES/ClickHouse 等系统提供在线的查询服务。对于实时链路, 数据会直接进入到 HBase/ES 提供高并发低时延的在线查询服务,另一方面数据会流入到 Cli... 为了快速定位数据的物理位置,用户可以在 DDL 中选择合适的 Index,Krypton 支持的 Index 如下:1. Ordinal Index:根据行号快速查找目标的 Data Page。1. Sparse Index:Min/Max、Bloom Filter 以及 Ribbon Filte...
1 HBase基本概念HBase 是一个开源的非关系型分布式数据库,它参考了 Google 的 BigTable 模型,实现语言为 Java。它是 Apache 软件基金会的 Hadoop 项目的一部分,运行在 HDFS 文件系统之上,为 Hadoop 提供类 BigTabl... HBase 不会就地修改数据,因此删除操作通过创建称为墓碑的新标记来处理。这些删除标记会在compaction时候清理。 3 HBase snapshot 迁移3.1 生成快照使用 HBase Shell 命令进入交互式查询,执行下面命令,对表名为 t1 ...
调用 DescribeZones 接口查询表格数据库 HBase 版指定地域下的可用区资源信息。 请求类型同步请求。 请求参数名称 类型 是否必选 示例值 描述 RegionId String 是 cn-beijing 地域 ID。 说明 您可以调用 DescribeRegions 接口查询 HBase 实例所有可用的地域资源信息,包括地域 ID。 返回数据名称 类型 示例值 描述 Zones Array of ZoneInfo 请参见返回示例。 可用区列表。关于 ZoneInfo 的详细说明,请参见数据结构。 请求示...
Phoenix简介 Phoenix是构建在HBase上的一个SQL层,能让我们用标准的JDBC APIs而不是HBase客户端APIs来创建表,插入数据和对HBase数据进行查询。Phoenix完全使用Java编写,作为HBase内嵌的JDBC驱动。Phoenix查询引擎会将SQL查询转换为一个或多个HBase扫描,并编排执行以生成标准的JDBC结果集。直接使用HBase API、协同处理器与自定义过滤器,对于简单查询来说,其性能量级是毫秒,对于百万级别的行数来说,其性能量级是秒。 Phoenix执行方...
调用 DescribeDBAccounts 接口查询 HBase 实例的数据库账号信息。 请求类型同步请求。 请求参数名称 类型 是否必选 示例值 描述 InstanceId String 是 hb-cncq0cf70709**** 实例 ID。 说明 您可以调用 DescribeDBInstance 接口查询目标地域下所有实例的基本信息,包括实例 ID。 PageSize Integer 是 10 每页记录数。取值范围 1~1000,默认值为 10。 PageNumber Integer 是 1 页码。取值大于等于 1,且不超过 Integer 的最大值...
表格数据库 HBase 版支持冷热分离,通过不同的存储介质,有效降低存储成本。 背景信息随着业务的迭代和广泛应用,表中的数据量持续上涨,但随着时间流逝,很多数据的访问频率会逐步减少。例如账单、订单等信息,一般只会查询近半年内的数据详情。甚至对于一些监控数据,遇到问题时,通常也是查看近一两天的内的数据,之前大量的历史数据,直接会被闲置。因此,表格数据库 HBase 版根据数据冷热需要提供不同的存储模式,系统会根据设置的冷热分...
调用 CreateDBAccount 接口为 HBase 实例创建数据库账号。 请求类型同步请求。 请求参数名称 类型 是否必选 示例值 描述 InstanceId String 是 hb-cncq0cf70709**** 实例 ID。 说明 您可以调用 DescribeDBInstance 接口查询目标地域下所有实例的基本信息,包括实例 ID。 AccountName String 是 test1 数据库账号名称。账号名称需满足以下要求: 账号名称在当前实例下唯一。 长度需要在 2~32 个字符内。 由字母、数字、中...
调用 DescribeRegions 接口查询表格数据库 HBase 版可用的地域资源信息。 请求类型同步请求。 请求参数名称 类型 是否必选 示例值 描述 RegionId String 否 cn-beijing 地域 ID。 说明 若该参数留空,会返回当前账号下所有可用的地域资源信息。 返回数据名称 类型 示例值 描述 Regions Array of RegionInfo 请参见返回示例。 地域信息列表。关于 RegionInfo 的详细说明,请参见数据结构。 请求示例json POST https://hbase.v...
调用 ResetDBAccount 接口修改 HBase 实例的数据库账号密码。 请求类型同步请求。 注意事项重置密码可能会导致使用该账号的连接中断,请谨慎操作。 请求参数名称 类型 是否必选 示例值 描述 InstanceId String 是 hbase-cn0212gzmh2xs**** 实例 ID。 说明 您可以调用 DescribeDBInstance 接口查询目标地域下所有实例的基本信息,包括实例 ID。 AccountName String 是 test1 账号名称。 说明 您可以调用 DescribeDBAccoun...
调用 DeleteDBEndpoint 接口关闭指定连接地址的公网访问。 注意事项关闭公网访问后,对应的公网访问地址将被删除,客户端将无法通过原有的公网地址访问 HBase 实例。请确认您的业务没有使用公网地址,以免造成损失。 关闭公网访问后,对应公网访问地址所用的 EIP 会自动解绑,解绑的 EIP 会继续保留并扣费,如不再使用请自行释放相关资源。EIP 释放方法,请参见释放公网 IP。 为保障数据库数据安全,关闭公网访问后,建议您及时删除 IP 白...