You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

数据库模型图的基数是指

社区干货

一文理解 HyperLogLog(HLL) 算法 | 社区征文

被广泛用于各个数据库产品中。与精确的基数统计算法相比,HLL 具备**可合并性 (mergeability)** ,因而可以方便地对海量数据进行并行计算,被广泛地用于大数据多维分析场景中。例如分别统计一款 APP 每个小时的 UV 以及全天的 UV,这类问题就非常适合使用 HLL 算法。本文将会由浅入深,从基本概念讲起,引导读者从直观上理解 HLL 算法背后蕴含的基本思想。# 基数统计基数 (Cardinality) 是指一个字段所包含的不同取值的个数,有...

[数据库系统] 业界列式存储浅析

C-Store 支持标准的关系型数据模型,一个数据库包含多张表,每张表包含多个attribute(column)。数据在C-Store里面不是根据逻辑数据类型进行物理存储的。反之大多数rowstore是直接存储物理表的,然后添加各种各样的index来加速访问,C-Store 只实现了 projections。一个 projection 与一个逻辑表T绑定,包含该逻辑表中的一个或者多个attributes。一个projection也可以包含其他表的任意数量的attributes,只要有一个外键能链接绑定的表到...

字节跳动自研万亿级图数据库 & 图计算实践

数据的分析和计算需求也逐渐显现。在这篇文章中,将从 ByteGraph 的适用场景、内部架构、关键问题分析几个方面作深入介绍,并将介绍图计算相关实践。 自研图数据库(ByteGraph)介绍 从数据模型角度看,图数据库内部数据是有向属性图,其 **基本元素是 Graph 中的点(Vertex)、边(Edge)以及其上附着的属性** ;作为一个工具,图数据对外提供的接口都是围绕这些元素展开。**图数据库本质也是一...

一文读懂火山引擎云数据库产品及选型

时序型 NoSQL 数据库主要应用在一些与时间强相关的数据模型,例如 IoT、监控数据等场景。对于时间序列相关的数据,时序型 NoSQL 数据库的处理与关系型数据库的处理方式是不一样的,时序型 NoSQL 数据库主要是有效地收集、存储和查询高频产生的各种时间序列数据,对此做了专门的设计和优化,专门用于这类场景。 NoSQL 数据库主要用于处理“关系”数据。这里的“关系”不是关系型数据库中的关系,而是指不同对象之间的联系。例如,社交...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

数据库模型图的基数是指-优选内容

一文理解 HyperLogLog(HLL) 算法 | 社区征文
被广泛用于各个数据库产品中。与精确的基数统计算法相比,HLL 具备**可合并性 (mergeability)** ,因而可以方便地对海量数据进行并行计算,被广泛地用于大数据多维分析场景中。例如分别统计一款 APP 每个小时的 UV 以及全天的 UV,这类问题就非常适合使用 HLL 算法。本文将会由浅入深,从基本概念讲起,引导读者从直观上理解 HLL 算法背后蕴含的基本思想。# 基数统计基数 (Cardinality) 是指一个字段所包含的不同取值的个数,有...
[数据库系统] 业界列式存储浅析
C-Store 支持标准的关系型数据模型,一个数据库包含多张表,每张表包含多个attribute(column)。数据在C-Store里面不是根据逻辑数据类型进行物理存储的。反之大多数rowstore是直接存储物理表的,然后添加各种各样的index来加速访问,C-Store 只实现了 projections。一个 projection 与一个逻辑表T绑定,包含该逻辑表中的一个或者多个attributes。一个projection也可以包含其他表的任意数量的attributes,只要有一个外键能链接绑定的表到...
字节跳动自研万亿级图数据库 & 图计算实践
数据的分析和计算需求也逐渐显现。在这篇文章中,将从 ByteGraph 的适用场景、内部架构、关键问题分析几个方面作深入介绍,并将介绍图计算相关实践。 自研图数据库(ByteGraph)介绍 从数据模型角度看,图数据库内部数据是有向属性图,其 **基本元素是 Graph 中的点(Vertex)、边(Edge)以及其上附着的属性** ;作为一个工具,图数据对外提供的接口都是围绕这些元素展开。**图数据库本质也是一...
一文读懂火山引擎云数据库产品及选型
时序型 NoSQL 数据库主要应用在一些与时间强相关的数据模型,例如 IoT、监控数据等场景。对于时间序列相关的数据,时序型 NoSQL 数据库的处理与关系型数据库的处理方式是不一样的,时序型 NoSQL 数据库主要是有效地收集、存储和查询高频产生的各种时间序列数据,对此做了专门的设计和优化,专门用于这类场景。 NoSQL 数据库主要用于处理“关系”数据。这里的“关系”不是关系型数据库中的关系,而是指不同对象之间的联系。例如,社交...

数据库模型图的基数是指-相关内容

VikingDB:大规模云原生向量数据库的前沿实践与应用

向量数据库近来的火热来源于大语言模型的兴起,但在大模型兴起之前,VikingDB 已经在字节内部广泛应用,最初应用在推荐、广告、搜索的召回环节,后来逐步扩展到了消重、风控、对话、文档搜索等需要向量检索的其他场景。... 预估过滤比例实现最优执行路径,支持检索调试信息返回。* 自研 UDF 过滤函数注入机制,实现灵完备的过滤计算。**极端规模场景**除了在线检索相关的性能问题外,离线建库中会有一些极端场景,诸如亿级数据天级...

一文读懂火山引擎云数据库产品及选型

时序型 NoSQL 数据库主要应用在一些与时间强相关的数据模型,例如 IoT、监控数据等场景。对于时间序列相关的数据,时序型 NoSQL 数据库的处理与关系型数据库的处理方式是不一样的,时序型 NoSQL 数据库主要是有效地收集、存储和查询高频产生的各种时间序列数据,对此做了专门的设计和优化,专门用于这类场景。 NoSQL 数据库主要用于处理“关系”数据。这里的“关系”不是关系型数据库中的关系,而是指不同对象之间的联系。例如,社...

一文读懂火山引擎云数据库产品及选型

时序型NoSQL数据库主要应用在一些与时间强相关的数据模型,例如IoT、监控数据等场景。对于时间序列相关的数据,时序型NoSQL数据库的处理与关系型数据库的处理方式是不一样的,时序型NoSQL数据库主要是有效地收集、存储和查询高频产生的各种时间序列数据,对此做了专门的设计和优化,专门用于这类场景。NoSQL数据库主要用于处理‘关系’数据。这里的‘关系’不是关系型数据库中的关系,而是指不同对象之间的联系。例如,社交关系(人与...

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

分布式数据库在抖音春晚活动中的应用

## 分布式数据库架构简介![image.png](https://p1-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/9ca5ef2ef9af4cedb544547a86a09a3e~tplv-k3u1fbpfcp-5.jpeg?)相信对数据库感兴趣的同学对上面这张也不会陌生。这... 缺了上述任意一个模块都很难构建出一个具有完备 ACID 特性的关系型数据库。了解关键子模块后,我们来看看计算层的数据模型。对于用户或者后端应用开发者来说,数据库可能是用户、数据库和数据表的一个集合;但是对于...

未来向量数据库的崛起与多元化场景创新 主赛道 | 社区征文

随着大模型的兴起,向量数据库越来越成为开发者关注的重点。## 一、概述:![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/bc50dc4519a14312bdb4dfa25da7fc1b~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1713975639&x-signature=9ZQSbdqT1LRo4ff9C%2F4%2FUnM%2F49c%3D)随着人工智能时代的来临,我们要更有效的解决象、语音和视频等各种非结构化数据。这种信息往往有复杂的...

[数据库论文研读] HTAP行列混存 & 智能转换

这么做无非是把外边的多套子系统称为子模块,取消了原本的后台数据同步机制,整合到一个黑盒里,称为HTAP数据库罢了。这么做的话数据仍然要存两份(row & column),管控面的麻烦从外部转移到内部而已,并没有什么实际的架... 那到底FSM的具体结构是怎样的呢?**实际上笔者认为,FSM正如它的名字,并没有一个“标准”的实现,更多强调“Flexible”** 。接下来我们就看看作者在论文中提出的一种灵活的存储结构——Tile-Based Architecture。#...

抖音大规模实践,火山引擎向量数据库是这样炼成的

如何用好大模型是当前各行各业瞩目的焦点。向量数据库作为大模型“记忆体”,不仅能够为其提供数据存储,而且能通过数据检索、分析让大模型进行知识增强,成为生成式 AI 应用开发新范式的重要组成部分。用图片搜索... 业界通常有两种解决方案:一是后过滤,将排名 top 的 K 个结果扩大一定倍数,检索出更多的向量,然后用结构化数据做过滤,留下 topK 个,这种方法适用于结构化过滤掉的比例较低,向量召回结果比例较高的场景;二是先过滤,先...

工业大数据分析与应用——知识总结 | 社区征文

存储在数据库中 * 90%的非结构化数据,它们与人类信息密切相关 * **结构化数据**,简单来说就是**数据库**。 * **非结构化数据**,数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二位逻辑... 数据也是工业大数据“不可忽视”的重要来源。> 工业大数据的特点* 多源性获取,数据分散,非结构化数据比例大* 数据蕴含信息复杂,关联性强* 持续采集,具有鲜明的动态时空特性* 采集、存贮、处理实时性要求高...

字节跳动 NoSQL 的探索与实践

作为业内最大的生态之一,现有的一些开源解决方案还不能满足字节跳动对图场景的需求。所以在 2018-2019 年,字节跳动就尝试自研分布式图数据库,最初是为了解决抖音关系的多度在线查询(约百万 QPS),当时最主要的功能是支持定制点和边的接口。 在 2019 年-2021 年,ByteGraph 已经支持了属性图模型和 Gremlin 语法,也在公司内部广泛落地,集群数量快速扩张,并逐步标准化。目前字节跳动在图数据库方面的多篇论文已被 VLDB 等数据库顶...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

从ClickHouse到ByteHouse
关于金融、工业互联网,都有对应的场景特性、解决策略、实践效果具体呈现,相信一定能解决你的诸多疑惑
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询