它提供了一个成熟的企业级SQL on HBase解决方案。Trafodion的主要设计思想是处理operational类型的工作负载,或者是传统的OLTP应用。2006年,NonStop SQL的OLAP分支Neoview诞生,而Trafodion直接继承于Neoview和其后续产品SeaQuest。SeaQuest将Neoview从其专有的硬件,和专有的NonStop OS操作系统中移植到通用的x86服务器和通用的Linux操作系统上。2014年,乘着大数据的浪潮,SeaQuest将底层的数据存储和访问引擎移植到HBase/Hadoop上,...
# 背景为了解决公司模型&特征迭代的系统性问题,提升算法开发与迭代效率,部门立项了特征平台项目。特征平台旨在解决数据存储分散、口径重复、提取复杂、链路过长等问题,在大数据与算法间架起科学桥梁,提供强有力的样本及特征数据支撑。平台从 Hive 、Hbase 、关系型数据库等大数据 ODS ( Operational Data store ) 层进行快速的数据 ETL ,将数据抽取到特征平台进行管理,并统一了数据出口,供数据科学家、数据工程师、机器学习工程...
此外还了解其他技术如HBase、Sqoop等。同时学习计算机网络知识和操作系统原理。后面再系统学习关系数据库MySQL和数据仓库理论。学习分布式原理和架构也很重要。这个学习顺序参考了我之前的工作和学习经历情况后订定。需要注意,大数据领域的技术很多很广,如Flink也值得研究。本人给出的仅作为一个参考案例,学习者还需结合实际情况选择合适的学习路径。![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-t...
列存:以 HBase 为代表; - 图、时序等新兴的数据库也都属于 NoSQL 范畴。如今 NoSQL 在字节跳动有非常广泛的应用:数万 NoSQL 应用实例,10W+ 台物理服务器资源,字节跳动超过 90% 的在线服务都是 NoSQL 系统提供的。### NoSQL 产品矩阵![]()![image.png](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/1acac0e48b9142d6b67d6b40c5db6059~tplv-k3u1fbpfcp-5.jpeg?)上图是字节跳动 NoSQL 的产品矩阵。我们对内对...
为提高存储效率,降低存储成本,表格数据库 HBase 版提供字典压缩功能。本文介绍如何开启字典压缩功能。 功能介绍字典压缩(ZSTD_DICT)是 HBase 深度优化的压缩算法,在 ZSTD 压缩算法的基础上进行了字典采样的优化,能够进一步压缩存储空间,数据压缩比可高达 10:1 以上。经实际测试,当开启字典压缩功能后,数据量明显减少,不同压缩算法的对比结果如下: 车联网数据 数据类型 原始数据 ZSTD 字典压缩 Snappy LZ4 车联网数据 9.7GB 722MB...
调用 DescribeDBInstanceDetail 接口查询指定实例的详细信息。 请求类型同步请求。 请求参数名称 类型 是否必选 示例值 描述 InstanceId String 是 hb-cn019f341d51**** 实例 ID。 说明 您可以调用 DescribeDBInstances 接口查询目标地域下所有 HBase 实例的基本信息,包括实例 ID。 返回数据名称 类型 示例值 描述 ChargeType String PostPaid 计费类型,取值: PostPaid:按量计费(后付费)。 PrePaid:包年包月(预付费)。 ...
调用 ModifyDBInstanceSpec 接口修改指定实例的规格。 请求类型异步请求。 注意事项变更节点规格过程中,实例可能会出现 1~3 分钟的断连。请谨慎操作。建议在业务低峰期执行变配操作,并确保客户端配置了正确的重试机制。更多详情,请参见变更实例配置。 请求参数名称 类型 是否必选 示例值 描述 InstanceId String 是 hb-bbf19cb0**** 实例 ID。 说明 您可以调用 DescribeDBInstances 接口查询目标地域下所有 HBase 实例的基本...
Phoenix简介 Phoenix是构建在HBase上的一个SQL层,能让我们用标准的JDBC APIs而不是HBase客户端APIs来创建表,插入数据和对HBase数据进行查询。Phoenix完全使用Java编写,作为HBase内嵌的JDBC驱动。Phoenix查询引擎会将SQL查询转换为一个或多个HBase扫描,并编排执行以生成标准的JDBC结果集。直接使用HBase API、协同处理器与自定义过滤器,对于简单查询来说,其性能量级是毫秒,对于百万级别的行数来说,其性能量级是秒。 Phoenix执行方...
调用 RestartDBInstance 接口重启指定实例。 请求类型异步请求。 请求参数名称 类型 是否必选 示例值 描述 InstanceId String 是 hb-cngl56292097**** 实例 ID。 说明 您可以调用 DescribeDBInstances 接口查询目标地域下所有 HBase 实例的基本信息,包括实例 ID。 ClientToken String 否 WbiAlPqJM6tMoSOYhT**** 用于保证请求的幂等性,防止重复提交请求。由客户端生成该参数值,要保证在不同请求间唯一,大小写敏感且不超过 ...
调用 DescribeAllowLists 接口查询当前账号下指定地域内的所有 IP 白名单信息。 请求类型同步请求。 请求参数名称 类型 是否必选 示例值 描述 RegionId String 是 cn-beijing 地域 ID。 说明 您可以调用 DescribeRegions 接口查询 HBase 实例所有可用的地域资源信息,包括地域 ID。 InstanceId String 否 hb-cnglbbb73ea0**** 实例 ID。 说明 您可以调用 DescribeDBInstances 接口查询目标地域下所有 HBase 实例的基本信...
调用 ModifyInstanceChargeType 接口将 HBase 实例的计费类型由按量计费转换为包月包月。 请求类型异步请求。 请求参数名称 类型 是否必选 示例值 描述 InstanceIds String 是 hbase-cn02he8bhzsji**** 实例 ID。 ChargeType String 是 PrePaid 修改后的实例计费类型,取值固定为 PrePaid:包年包月(预付费)。 PurchaseMonths Integer 否 1 购买时长。单位:月。取值范围:1(默认),2,3,4,5,6,7,8,9,12,24,36。 说明 仅当 ChargeT...
本文汇总表格数据库 HBase 版提供的 API 接口。 地域和可用区API 描述 DescribeRegions 调用 DescribeRegions 接口查询表格数据库 HBase 版可用的地域资源信息。 DescribeZones 调用 DescribeZones 接口查询表格数据库 HBase 版指定地域下的可用区资源信息。 实例管理API 描述 CreateDBInstance 调用 CreateDBInstance 接口创建 HBase 实例。 DescribeDBInstances 调用 DescribeDBInstances 接口查询 HBase 实例列表信息。 Descr...
本文介绍如何使用 Java API 访问 HBase 实例。 前提条件如需通过私网地址访问 HBase 实例,需同时满足如下要求:已购 ECS 服务器与 HBase 实例在相同私有网络 VPC 下。ECS 服务器的购买方法,请参见购买云服务器。 已... // config.set(HConstants.ZOOKEEPER_QUORUM, ); config.set(HConstants.ZOOKEEPER_ZNODE_PARENT, "/hbase/ "); //HConstants.ZOOKEEPER_ZNO Connection connection ...