易扩展,容错率高## HDFS 在字节跳动的发展字节跳动已经应用 HDFS 非常长的时间了。经历了 9 年的发展,目前已直接支持了十多种数据平台,间接支持了上百种业务发展。从集群规模和数据量来说,HDFS 平台在公司内部已经成长为总数十万台级别服务器的大平台,支持了 10 EB 级别的数据量。**当前在字节跳动,** **HDFS** **承载的主要业务如下:**- Hive,HBase,日志服务,Kafka 数据存储 - Yarn,Flink 的计算框架平台数据 -...
QianBase是基于Trafodion架构。Trafodion是HP公司资助的一个开源项目。它提供了一个成熟的企业级SQL on HBase解决方案。Trafodion的主要设计思想是处理operational类型的工作负载,或者是传统的OLTP应用。2006年,NonStop SQL的OLAP分支Neoview诞生,而Trafodion直接继承于Neoview和其后续产品SeaQuest。SeaQuest将Neoview从其专有的硬件,和专有的NonStop OS操作系统中移植到通用的x86服务器和通用的Linux操作系统上。2014年,乘着大...
此外还了解其他技术如HBase、Sqoop等。同时学习计算机网络知识和操作系统原理。后面再系统学习关系数据库MySQL和数据仓库理论。学习分布式原理和架构也很重要。这个学习顺序参考了我之前的工作和学习经历情况后订定。需要注意,大数据领域的技术很多很广,如Flink也值得研究。本人给出的仅作为一个参考案例,学习者还需结合实际情况选择合适的学习路径。![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-t...
> 本文结构采用宏观着眼,微观入手,从整体到细节的方式剖析 Hive SQL 底层原理。第一节先介绍 Hive 底层的整体执行流程,然后第二节介绍执行流程中的 SQL 编译成 MapReduce 的过程,第三节剖析 SQL 编译成 MapReduce 的具体实现原理。### 一、HiveHive是什么?Hive 是数据仓库工具,再具体点就是一个 SQL 解析引擎,因为它即不负责存储数据,也不负责计算数据,只负责解析 SQL,记录元数据。Hive直接访问存储在 HDFS 中或者 HBase ...
本文介绍表格数据库 HBase 版的产品功能动态和相关文档。 2024 年 04 月功能 功能描述 发布时间 发布地域 相关文档 支持开启登录认证 支持在创建实例时,开启登录认证。开启后需要通过账号和密码来连接 HBase 实例。登录认证,仅对 Java 客户端生效,Thrift 连接依旧采用直连方式。 2024-04-28 全部 创建实例 连接实例 新增账号管理 开启登录认证后,支持创建账号、删除账号和重置账号密码。该账号仅用于登录认证,不涉及对 Name...
调用 CreateDBInstance 接口创建 HBase 实例。 请求类型异步请求。 请求参数名称 类型 是否必选 示例值 描述 RegionId String 是 cn-beijing 地域 ID。 说明 您可以调用 DescribeRegions 接口查询 HBase 实例所... 只能包含中文、字母、数字、下划线(_)和中划线(-)。 长度需要在 1~128 个字符内。 说明 若该参数留空,实例 ID 会默认作为实例名称。 InstanceType String 否 Standard 实例类型。当前仅支持标准型,取值默认为 S...
操作步骤登录 HBase 控制台。 在顶部菜单栏的左上角,选择实例所属的地域。 在实例列表页,单击创建实例。 在创建实例页,设置如下参数。 类别 参数 说明 基本信息 实例名称 输入实例名称。选填。若不填,实例 ID 默认作为实例名称。名称需同时满足如下要求: 不能以数字、中划线(-)开头。 只能包含中文、字母、数字、下划线(_)和中划线(-)。 长度需要在 1~128 个字符内。 实例类型 当前仅支持标准版,无需选择。 数据库版本 当...
操作步骤登录 HBase 控制台。 在顶部菜单栏的左上角,选择实例所属的地域。 在实例列表页,单击创建实例。 在创建实例页,设置如下参数。 类别 参数 说明 基本信息 实例名称 输入实例名称。选填。若不填,实例 ID 默认作为实例名称。名称需同时满足如下要求: 不能以数字、中划线(-)开头。 只能包含中文、字母、数字、下划线(_)和中划线(-)。 长度需要在 1~128 个字符内。 实例类型 当前仅支持标准版,无需选择。 数据库版本 当...
本文介绍如何创建和删除 HBase 实例的数据库账号。 前提条件已创建实例,且已开启登录认证,操作详情请参见创建实例。 注意事项HBase 实例的数据库账号仅用于登录认证,不涉及对 Namespace(命名空间)的权限管理。 开... 中文、英文、下划线(_)、短横线(-)。 密码 数据库账号的密码。密码规则如下: 长度需要在 8~32 个字符内。 由大写字母、小写字母、数字、特殊字符 _!@$%^&*()+=- 组成。 至少包含大写字母、小写字母、数字或特殊...
表格数据库 HBase 版实例创建成功后,您可以为实例设置白名单,以允许设备访问该实例。本文介绍如何编辑白名单,包括修改分组名称和 IP 地址。 前提条件设置白名单前,您需要先获取客户端 IP 地址。 访问方式 IP 地址获... 只能包含中文、字母、数字、下划线(_)和中划线(-)。 长度需为 1~32 个字符。 单击确定。 修改白名单 IP 地址 单击目标白名单名称。 在弹出的控制面板中,单击 IP地址后的图标。 在 IP 地址对话框中,输入 IP 地址...
调用 CreateDBAccount 接口为 HBase 实例创建数据库账号。 请求类型同步请求。 请求参数名称 类型 是否必选 示例值 描述 InstanceId String 是 hb-cncq0cf70709**** 实例 ID。 说明 您可以调用 DescribeDBInst... 中文、英文、下划线(_)、短横线(-)。 ClientToken String 否 WbiAlPqJM6tMoSOYhT**** 用于保证请求的幂等性,防止重复提交请求。由客户端生成该参数值,要保证在不同请求间唯一,大小写敏感且不超过 127 个 ASCII 字符...
调用 ModifyDBInstanceName 接口修改实例名称。 请求类型同步请求。 请求参数名称 类型 是否必选 示例值 描述 InstanceId String 是 hb-cn019f341d51**** 实例 ID。 说明 您可以调用 DescribeDBInstances 接口查询目标地域下所有 HBase 实例的基本信息,包括实例 ID。 InstanceName String 是 test_api 修改后的实例新名称。名称需同时满足以下要求: 不能以数字、中划线(-)开头。 只能包含中文、字母、数字、下划线(_)和...
易扩展,容错率高## HDFS 在字节跳动的发展字节跳动已经应用 HDFS 非常长的时间了。经历了 9 年的发展,目前已直接支持了十多种数据平台,间接支持了上百种业务发展。从集群规模和数据量来说,HDFS 平台在公司内部已经成长为总数十万台级别服务器的大平台,支持了 10 EB 级别的数据量。**当前在字节跳动,** **HDFS** **承载的主要业务如下:**- Hive,HBase,日志服务,Kafka 数据存储 - Yarn,Flink 的计算框架平台数据 -...