本文为您介绍 ByteHouse 云数仓版相关功能的最新动态。新特性将在各个地域陆续发布,欢迎体验。部分新功能可能需要申请白名单权限或处于灰度测试阶段。建议您在体验新功能前,查阅相关功能的用户文档,了解使用权限或要求。如需开白或使用中遇到问题,请提交工单或联系 ByteHouse 团队。
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
对象表 | 新增支持对象表。ByteHouse 云数仓版通过对象表建立与火山引擎对象存储(TOS)的连接,将对象存储中的非结构化数据(如文本、图像等)映射成 ByteHouse 内部表,适用于多模态数据管理(如 AI 场景下的图像、文本等非结构化数据)场景。 | 2025年12月 | |
图/文向量可视化检索 | 新增支持图/文向量可视化检索。ByteHouse 云数仓版支持通过可视化方式实现图/文向量检索,支持文本、图片及图文混合的多模态向量检索,支持检索对象的创建、管理与检索测试,适用于金融合规、电商推荐、智能驾驶、游戏等多领域中需要高效检索非结构化数据的场景,显著提升检索效率,适配复杂业务需求。 | 2025年12月 | |
备份恢复 | 新增支持数据增量恢复,支持指定任意时间点精准恢复。您可灵活选择全量恢复、全量 + 增量恢复两种策略,既保障数据完整性与安全性,又大幅减少恢复耗时,提升数据恢复效率。 | 2025年12月 | |
异步物化视图 | 新增支持为异步物化视图配置安全优化参数,助力提升查询性能。使用前需联系 ByteHouse 团队,按需开启对应参数。 | 2025年12月 | |
统计信息 | 新增统计信息开关功能。启用后,可开启优化器 CBO 优化能力,可进一步优化查询效率和写入性能,但同时将占用默认写计算组部分资源。 | 2025年12月 | |
网络信息 | 网络信息模块在本版本中优化了以下功能点:
| 2025年12月 |
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
智能助手 | 新增支持自然语言生成 SQL。ByteHouse 智能助手将您输入的自然语言生成 SQL 语句,支持生成查询示例语句、SQL 查询优化等功能。 | 2025年10月 | |
外部 Catalog |
| 2025年10月 | |
缓存加载 |
| 2025年10月 | |
【Beta】分布式缓存 | 新增支持分布式缓存。分布式缓存是 ByteHouse 云数仓版提供的缓存共享解决方案,依托分布式缓存技术,通过跨计算节点分布式部署,实现全局共享缓存资源,可有效提升数据查询性能,满足您对高性能查询和稳定性的需求。 | 2025年10月 | |
计算组本地盘 | 智能缓存名称调整为计算组本地盘,更易于理解。 | 2025年10月 | |
项目/标签分账 | 新增支持为计算组、专属 Server、存储资源绑定项目或标签。配置后,您可在火山引擎费用中心使用费用分析功能,查看不同项目或标签的费用明细,实现云上资源成本的精准管理。 | 2025年10月 | |
SQL 工作表 | SQL 工作表支持选择数据库。执行查询前,您可先选择目标数据库。后续执行查询时,直接在 SQL 语句中使用表名即可,无需额外指定数据库名称。 | 2025年10月 | |
任务中心 | 优化了任务中心的功能按钮和任务详情展示:
| 2025年10月 | |
数据权限 | 新增支持全局、UDF、外部 Catalog 等数据权限的管理,权限管理更加灵活。 | 2025年10月 | |
Hive 元数据缓存 | 新增支持 Hive 元数据缓存。为了加速对 Hive 外表的访问,ByteHouse 构建了 Hive 元数据缓存能力,将元数据信息缓存在 Server 内存中,实现减少 Hive Metastore 的访问开销,在业务频繁访问相同表或分区时,大幅提升查询性能。 | 2025年10月 | |
视图 SQL Security | 新增支持视图 SQL Security。ByteHouse 云数仓版引擎侧从 v2.3 开始,引入了视图 SQL Security 功能,为视图增加了定义者(DEFINER)和调用者(INVOKER)来控制视图的执行行为,适用于需要向不同用户提供受限数据访问权限的场景。 | 2025年10月 | |
区域 | 新增支持华北2(北京)自动驾驶云和华东2(上海)自动驾驶云1,可更好满足您对专属云的使用需求。 | 2025年10月 |
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
SQL 参数组 | 新增支持 SQL 参数组。SQL 参数组是指在 ByteHouse 控制台运行 SQL 语句时,提供的快捷参数,您可在 SQL 工作表中执行查询时选择所需 SQL 参数组,SQL 参数组将在 ByteHouse 控制台运行的 session 中生效。 | 2025年9月 | |
IAM 子用户 - 默认计算组设置 | 新增支持管理员为 IAM 子用户设置默认计算组,优化计算资源分配效率。 | 2025年9月 | |
缓存加载 |
| 2025年9月 | |
SQL 工作表 | 优化了 SQL 工作表,优化点如下:
| 2025年9月 | |
SQL 审计 |
| 2025年9月 | |
资源权限 - 全局审计日志 | 新增支持全局审计日志资源权限,支持管理员为子用户授予该权限,子用户获取该权限后,可查看全局审计日志。 | 2025年9月 |
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
【Beta】智能助手 | 新增支持智能助手,提供智能问答与 AI 日志检索功能,帮助您快速上手使用 ByteHouse。智能助手还支持关联用户知识库,更精准地定位问题。
| 2025年7月 | |
【Beta】知识库 | 新增支持知识库功能,支持您上传专属知识库,提供知识构建、管理与智能应用全流程能力,并通过细粒度权限管理保障数据安全,适用于企业业务知识管理、智能问答支持等场景。 | 2025年7月 | |
【Beta】计算组-负载弹性 | 新增支持计算组负载弹性。负载弹性支持计算组的自动扩缩容,支持通过动态调配弹性资源,依据预设策略自动调整规格,适配业务负载波动。您可按需设置计算组的负载弹性策略,系统将根据设置的阈值自动扩缩容。 | 2025年7月 | |
计算组-库级写计算组 | 新增支持为某个数据库设置计算组,设置后,在该数据库中写入数据时,将使用设置的计算组资源。 | 2025年7月 | |
计算组-自定义参数 | 新增支持添加自定义 SQL 参数,进一步提升 SQL 执行效率,助力业务场景适配与数据处理体验的整体优化。 | 2025年7月 | |
SQL 审计 | SQL 审计历史列表新增支持展示 CPU 总耗时和内存最大用量。
| 2025年7月 | |
数据加密 | 新增支持数据透明加密功能,为整表或按列进行数据加密,强化核心数据安全,满足您的监管和合规需求。 | 2025年7月 |
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
外部 Catalog | ByteHouse 支持可视化展示和管理外部 Catalog,支持增删 Catalog、查看 Catalog 中的数据库和表信息、配置 Catalog 资源和数据权限。 | 2025年6月 | |
IP 白名单管理 | 新增支持 IP 白名单管理,支持设置可以访问的 IP 范围,实现精细化访问控制。 | 2025年6月 | |
诊断分析-智能巡检 | 新增支持智能巡检。智能巡检是一种预防性维护措施,用于检查系统的状态,及时发现潜在问题。该功能支持根据巡检项输出报告,您可以提前发现和解决问题,减少系统故障和停机时间,提升系统的稳定性和可靠性。 | 2025年6月 | |
日志探索分析 | 新增支持日志探索分析功能,支持全文可视化检索。该功能类似于 Kibana 的 Discover 功能,为您提供日志数据的可视化分析能力。此外,ByteHouse 还集成了基于 AI 能力的检索助手,为您提供自动生成查询 SQL 语句和日志洞察功能,让您通过自然语言输入,即可快速完成日志的查询分析,获取分析报告和优化建议。 | 2025年6月 | |
向量检索 | ByteHouse 向量检索功能支持对文本、图片、视频等非结构化数据的向量特征进行存储和高效的相似度检索,可应用于以图搜图、以图搜视频、文本检索、文本搜图等场景,也可以与大模型结合构建智能化应用。ByteHouse 向量检索功能当前支持通过 SQL 命令或 Python API 使用 HNSW 或 Faiss Indices 算法库进行向量检索。 | 2025年6月 | |
智能缓存 | 支持存量/实时数据刷入缓存,表级别/分区级别数据加载到缓存。 | 2025年6月 | |
【Beta】Binlog | 支持 Binlog 实时数据订阅 ,实现事件驱动的实时数仓。与 Flink 深度集成,支持 Flink 消费,实现增量数据生产/物化视图,将实时数仓的变更同步到其他系统。 | 2025年6月 | |
【Alpha】行存表&行级索引 | 支持行列混存,解决点查场景的 I/O 瓶颈问题,您在建表时指定开启行存后,点查每一行只需要一次 I/O,在宽表场景下性能实现数量级提升。 说明 行存表及行存索引功能为 Alpha 功能,可用于 PoC。如需使用行存表功能,请提交工单或联系 ByteHouse 团队获取白名单权限。 | 无 | 2025年6月 |
【Beta】动态分区表 | 新增支持了创建动态分区表和分桶表(bucket table)动态扩容功能。
| 2025年6月 | |
漏斗分析函数 | ByteHouse 新增支持漏斗分析专用函数,针对用户行为分析场景优化查询效率。该功能支持观察选定时间范围中每一个时间单位(天)内的用户漏斗分层汇总情况,帮助您高效分析用户转化路径。 | 2025年6月 | |
【Beta】Python UDF | 新增支持 Python 用户定义函数(UDF,User Defined Functions),支持使用 Python 语言定义函数处理数据,支持 CREATE、DROP、SHOW、SHOW CREATE、SELECT 函数。 | 2025年6月 | |
外表 | Hive 外表涉及以下更新点:
| 2025年6月 | |
监控告警 | 新增支持对缓存、专属 server 的监控告警,优化计算组监控,提供更全面的数据资源监控,及时发现问题,提升数据资源运行稳定性。 | 2025年6月 | |
Flink CDC connector | 支持 multi-sink 部分列更新。 | 无 | 2025年6月 |
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
计算组参数管理 | 创建计算组支持选择计算组类型 OLAP 类型和 ELT 类型,编辑计算组支持计算组参数管理,包括修改列表权限、切换计算组、编辑参数。新增计算组类型说明如下:
| 2025年4月 | |
创建表 | 创建表支持使用表达式方式配置分区键,提供更多分区选择;编辑表界面优化,您仅需关注可编辑的表属性。 | 2025年4月 | |
专属 Server | 专属 Server 绑定写计算组流程优化,首次开通 ByteHouse 时同步开通专属 Server,系统默认使用开通时创建的计算组作为专属 Server 的默认写计算组。如果同时开通了多个计算组,系统将使用创建的第一个计算组作为默认写计算组。 | 2025年4月 | |
数据库账号 | ByteHouse 将 IAM 账号和数据库账号分离,支持独立创建数据库账号,并为该账号授予资源权限和数据权限,支持使用数据库账号通过 CLI、BI 工具、ELT 工具、IDE 工具、API 等方式访问 ByteHouse 数据库。 | 2025年4月 | |
诊断分析-分区健康度诊断 | 新增支持分区健康度监控和诊断,帮助您可视化查看分区情况,提供分区诊断信息,辅助优化分区表。 | 2025年4月 | |
同步物化视图 | 支持以可视化方式管理同步物化视图,您可通过 ByteHouse 控制台页面创建同步物化视图。 | 2025年4月 | |
异步物化视图 | 支持以可视化方式管理异步物化视图,您可通过 ByteHouse 控制台页面创建异步物化视图。 | 2025年4月 | |
环境管理 | 支持添加环境显示名称,更好地区分环境用途。支持在创建后修改环境显示名称。 | 2025年4月 |
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
专属Server | 专属Server新增 绑定写入计算组功能,购买专属Server时为专属Server绑定写入计算组后,进一步保障资源。 | 2025年3月 | |
缓存加载 | 新增 支持界面化创建缓存加载任务功能,您创建缓存加载任务,支持周期性加载存量数据,也支持实时加载最新写入的实时数据。 | 2025年3月 | |
计算组 | 购买计算组时,新增 支持自定义计算组规格能力,您可以在界面灵活选择购买N(11及以上)个XL规格的计算组,提高配置的灵活性。 | 无 | 2025年3月 |
审计日志 | 新增支持用户活动相关审计日志能力,您可以通过用户活动审计日志查看详细的用户行为日志数据,可查看的操作对象包括:备份&恢复、环境、网络、专属Server、用户&角色。您可以查看对应操作对象的增删改日志详情。 | 2025年3月 | |
SQL审计能力增强,您可打开详细日志开关,打开后即会在系统中为您生成一张query_log表,为您记录详细的SQL操作日志。 | 2025年3月 | ||
权限管控 | 增强了ByteHouse的权限管控能力,对计算组的权限管控范围新增支持USE、ALL。
| 2025年3月 |
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
环境管理 | 新增支持多环境管理能力, 从2.12版本起,支持用户根据需求设置多个环境,在不同环境中的计算、存储、库表、网络、审计和权限完全隔离,可以满足用户对多实例、接入多VPC等需求。 | 2024年12月 | |
外表 | 外表能力增强:
| 2024年12月 | |
备份恢复 | 新增支持数据备份功能,可以解决误删误改数据后恢复数据的问题,以及在极端情况下实现灾备功能。 | 2024年12月 | |
物化视图 | 支持异步多表物化视图,支持unique表物化视图。 | 2024年12月 | |
语法兼容性 | 新增自增列功能。 | 无 | 2024年12月 |
其他 | ByteHouse云数仓版开服地域新增 火山引擎-华北2(北京)自动驾驶云地域。 | 无 | 2024年12月 |
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
增加智能缓存功能 | 智能缓存功能可以将对象存储的冷数据缓存,增加数据热读概率,对于高性能、高QPS的场景,可以极大的提升用户的查询效率。 | 2024-11-20 | |
新增柔佛节点 | ByteHouse 云数仓版新增了柔佛节点,这是继 华北2 (北京)、华东2 (上海)和华南1(广州)之后的第四个节点。 | 2024-12-06 | |
专属Server购买 | 面向高并发、高QPS的业务场景,用户可增购独享的Server资源。 | 2024-12-13 |
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
界面优化 | 可视化库表管理(物化视图、外表、 库表 )体验优化。 | 2024-09-30 | |
审计日志 | 控制台增加了审计日志模块,可以审计管理 SQL 、计算组、权限。 | 2024-09-30 |
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
新增华南节点 | ByteHouse 云数仓版新增了华南1(广州)节点,这是继 华北2 (北京)、华东2 (上海)之后的第三个节点。 | 2024-07-31 | |
增强 ELT 能力 | ELT增强失败重试能力,可观测性日志,运维监控保障能力增强。 | 2024-08-15 | |
支持全文检索高级功能 | 全文检索(或仅文本搜索)提供了识别满足查询的自然语言文档的功能。 | 2024-08-15 | |
计算组增加性能型规格 | 计算组(VW) 增加性能型(XL plus,1:8)规格。 | 2024-08-15 | |
支持异步物化视图 | ByteHouse 新增了异步物化视图功能,可以更好的支持多表关联的场景,减少对于数据导入影响。 | 异步物化视图 | 2024-08-15 |
生态支持 | 加强了热门 BI(FineBi、Smartbi等)和IDE(DataGrip、DBeaver、Navicat)的支持。 | 2024-08-15 |
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
支持计费模式切换 | 支持 包年包月 与 按量付费 模式相互切换,为用户提供更灵活的付费模式。 | 2024-06-10 | |
权限管理能力增强 |
| 2024-06-10 | |
监控告警功能增强 | 支持 任务中心、存储、连接 模块可视化监控与自定义告警 | 2024-06-10 | |
数据导入支持校验 | 支持 通用模式、专家模式下的数据校验 | 2024-06-10 |
功能名称 | 功能描述 | 相关文档 | 发布时间 |
|---|---|---|---|
ELT 功能增强 | ELT能力支持BSP、查询队列、失败重试; | 2024-04-10 | |
优化 计费模式 | 租户级别计费模式下沉到计算组级别,在租户级别不再区分计费模式; | 2024-04-10 | |
支持全文检索能力 | 全文检索(或仅文本搜索)提供了识别满足查询的自然语言文档的功能。我们通过增加文本倒排索引的能力,来支持更快速的文本检索和过滤的方式。 | 2024-04-10 | |
MySQL兼容性增强 | MySQL兼容性适配度超过 80% 。 | 2024-04-10 |
功能名称 | 功能描述 | 发布时间 |
|---|---|---|
新增租户管理模块 |
| 2024-03-07 |
自定义监控告警功能 |
| 2024-03-07 |
查询历史优化 | 支持慢查询、错误查询、QueryID定向查询,解决大批量查询性能问题; | 2024-03-07 |
功能名称 | 功能描 | 发布时间 |
|---|---|---|
使用体验优化 |
| 2024-01-31 |
付费方式优化调整 |
| 2024-01-31 |
功能名称 | 功能描述 | 发布时间 |
|---|---|---|
功能增强优化 |
| 2023-12 |
性能与诊断优化 |
| 2023-12 |
功能名称 | 功能描述 | 发布时间 |
|---|---|---|
生态兼容提升 |
| 2023-10 |
新增功能 |
| 2023-10 |