配置 Hive 数据源(仅支持 Hive 读):Hive reader 通过 JDBC 客户端连接 HiveServer2 服务进行数据读取。 1 支持的版本火山引擎 E-MapReduce(EMR)Hive 数据源。 连接串形式支持 Hive 3.1 版本。 2 使用前提子账号新建数据源时,需要有项目的管理员角色,方可以进行新建数据源操作。各角色对应权限说明,详见:管理成员 访问 EMR-Hive 数据源,需先在项目控制台 > 服务绑定 > 引擎绑定中,绑定相应 EMR-Hadoop 集群。详见创建项目。 Hive 数据源配置选...
概述Hive 是一款基于 Hadoop 的数据仓库架构,可以通过 HiveQL(类 SQL 语言)对分布式存储中的大型数据集进行提取、转化和加载(ETL)操作,以及元数据管理。关于Hive的的更多的介绍,可以参考Apache Hive官网。 1 Hive 组件说明基本组件介绍如下: 名称 说明 Hive Client Hive Client 是 Hive 客户端,提供 Beeline、JDBC 应用所需的驱动包,通过该客户端可以向 HiveServer2 提交SQL作业。 Hive MetaStore Hive MetaStore 是 Hive 元数据管理...
Hive 使用 Proton1 概述说明火山引擎 E-MapReduce(EMR)自 EMR-3.1.1(对应 Hadoop 3.x 和 Hive 3.x)、EMR-2.2.0(对应 Hadoop 2.x 和 Hive 2.x)开始支持 Proton SDK。本文描述了如何在火山 EMR 的 Hive,或在自建 Hadoop 集群的 Hive 中使用 Proton SDK 读写 TOS 数据。 2 火山 EMR2.1 认证配置火山引擎 EMR 认证配置详见:Hadoop 使用 Proton - 认证配置。 3 自建 Hadoop 集群3.1 配置 Hadoop 环境根据不同 Proton 版本,下载对应的 Proton 包,详见:H...
Hive 基础操作shell su hive执行以下命令,进入 Hive 命令行。 shell hive返回信息如下所示时,表示进入 Hive 命令行 Hive Session ID = aaa9c23d-4975-4c10-bb9a-1817c5fa36e6Logging initialized using configuration in file:/etc/emr/hive/conf/hive-log4j2.properties Async: trueHive Session ID = 258437d2-f601-42c9-bab3-731b975b0642 3 库操作本文示例中的数据库以 testdb 为例介绍。 3.1 创建库shell CREATE DATABASE IF NOT EXIS...
Hive 中操作 Iceberg 数据Hive 支持通过内表或外表的方式访问 Iceberg 数据。本文通过示例为您介绍如何使用 E-MapReduce(EMR)上的 Hive 访问 Iceberg 数据。 1 前提条件适合 EMR 1.2.0以后的版本(包括EMR 1.2.0) 已创建 EMR 集群,且安装有 Iceberg 组件。有两种方式可以安装 Iceberg 组件: 在创建 EMR 集群时,选择 Icerberg 作为可选组件,详见:创建集群。 对已安装 EMR 集群,参考 服务管理章节 添加 Iceberg 服务 对于插入数据操作,要求 Hive 的执行引...
Hive 集成访问 Hive 数据有三种方式分别是 HiveServer2、Hive Client、HDFS。对于 HDFS 的访问权限控制可以参考 HDFS 配置章节,下面介绍 Ranger 对 Hive 数据的访问控制配置。 1 使用前提已创建 E-MapReduce(EMR)包含 Range... 进入 Ranger admin -> Access Manager -> HADOOP SQL-> 点击 default_hive,进入权限编辑界面。 Add New Policy,赋予 ranger 用户访问 table: test001 的 select 权限,配置如下: 4 Policy 验证4.1 beeline 访...
功能发布记录发布时间 版本号 主要更新 2023 年 7 月 13 日 v 1.7.1 提供 Hadoop HDFS/Hive 迁移工具,Hive 内部表类型,无缝迁移。 2023 年 5 月 16 日 v 1.7.0 支持数据冷热分层(廉价冷存储)、支持数据脱敏、支持查询血缘。 2023 年 2 月 23 日 v 1.6.0 支持队列定时扩缩容,支持内部表 UI 增删字段,支持自动构建物化视图,数据加密。 2022 年 11 月 08 日 v 1.5.0 支持 TTL 自动管理及删除数据,支持物化视图,支持队列权限审批流。 2022 年 8 ...