You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

数据库系统工程师学习思维导图

社区干货

VikingDB:大规模云原生向量数据库的前沿实践与应用

火山引擎向量数据库高级工程师 VikingDB 简介 ![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/8830cd001d2c4694b5e623cc645246af~tplv-tld... 会对数据系统造成稳定性相关的影响。特别是在导入非结构化数据这类场景,有计算 embeeding 这类高耗时的操作。为了避免单一用户的突发写入占用过多资源影响其他用户,VikingDB 引入了quota 和异步多队列机制来保证租...

字节跳动数据库的过去、现状与未来

数据库资深工程师张雷,跟大家分享了《[字节跳动数据库的过去、现状与未来](https://mp.weixin.qq.com/s/4Bvo0EBo_xtKdVcqhGynCQ)》,本文根据分享整理而成。数据库技术一直是信息技术中极其重要的一环,在步入云原生时代后,云基础设施和数据库进一步整合,弥补了传统数据库的痛点,带来了高可扩展性、全面自动化、快速部署、节约成本、管理便捷等优势。从 2018 到 2021 年,伴随业务和数据的迅猛增长,字节跳动的分布式数据库系统取...

我在字节跳动研发数据库|火山引擎开发者社区 Meetup 讲师访谈

《分布式数据库在抖音春晚活动中的应用》,小火山提前采访了马浩翔,和大家分享他对春晚红包项目印象深刻的事情,以及对分布式数据库的看法。 **小火山:简单介绍一下自己,有什么兴趣爱好?****马浩翔**:我硕士毕业于美国东北大学,目前担任数据库系统开发工程师。因为我 **来自工程师文化的家庭** ,所以在小学的时候就很喜欢鼓捣,经常把硬件拆了又装,还学习在 DOS 黑框里敲神奇的命令。长大后赶上了移动互联...

加速大模型落地:火山引擎向量数据库的实践应用

传统数据库已经无法满足如此多样化数据的处理需求。向量数据库以其海量的数据存储规模、高效的计算查询能力,正在成为大模型时代重要的基础设施。**3 月23 日**,火山引擎开发者社区 Meetup 第十三期邀请到了火... **《VikingDB:大规模云原生向量数据库的前沿实践与应用》**谢剑桥|火山引擎向量数据库高级工程师向量数据库是解决海量非结构化数据检索与分析问题的行业共识,我们从 19 年解决大规模分布式向量检索问题,到推...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

数据库系统工程师学习思维导图-优选内容

VikingDB:大规模云原生向量数据库的前沿实践与应用
火山引擎向量数据库高级工程师 VikingDB 简介 ![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/8830cd001d2c4694b5e623cc645246af~tplv-tld... 会对数据系统造成稳定性相关的影响。特别是在导入非结构化数据这类场景,有计算 embeeding 这类高耗时的操作。为了避免单一用户的突发写入占用过多资源影响其他用户,VikingDB 引入了quota 和异步多队列机制来保证租...
字节跳动数据库的过去、现状与未来
数据库资深工程师张雷,跟大家分享了《[字节跳动数据库的过去、现状与未来](https://mp.weixin.qq.com/s/4Bvo0EBo_xtKdVcqhGynCQ)》,本文根据分享整理而成。数据库技术一直是信息技术中极其重要的一环,在步入云原生时代后,云基础设施和数据库进一步整合,弥补了传统数据库的痛点,带来了高可扩展性、全面自动化、快速部署、节约成本、管理便捷等优势。从 2018 到 2021 年,伴随业务和数据的迅猛增长,字节跳动的分布式数据库系统取...
我在字节跳动研发数据库|火山引擎开发者社区 Meetup 讲师访谈
《分布式数据库在抖音春晚活动中的应用》,小火山提前采访了马浩翔,和大家分享他对春晚红包项目印象深刻的事情,以及对分布式数据库的看法。 **小火山:简单介绍一下自己,有什么兴趣爱好?****马浩翔**:我硕士毕业于美国东北大学,目前担任数据库系统开发工程师。因为我 **来自工程师文化的家庭** ,所以在小学的时候就很喜欢鼓捣,经常把硬件拆了又装,还学习在 DOS 黑框里敲神奇的命令。长大后赶上了移动互联...
加速大模型落地:火山引擎向量数据库的实践应用
传统数据库已经无法满足如此多样化数据的处理需求。向量数据库以其海量的数据存储规模、高效的计算查询能力,正在成为大模型时代重要的基础设施。**3 月23 日**,火山引擎开发者社区 Meetup 第十三期邀请到了火... **《VikingDB:大规模云原生向量数据库的前沿实践与应用》**谢剑桥|火山引擎向量数据库高级工程师向量数据库是解决海量非结构化数据检索与分析问题的行业共识,我们从 19 年解决大规模分布式向量检索问题,到推...

数据库系统工程师学习思维导图-相关内容

抖音大规模实践,火山引擎向量数据库是这样炼成的

向量数据库就是用于生产、存储、索引和分析来自机器学习模型产生的海量向量数据的数据库系统。其典型应用场景比如:基于大语言模型的智能客服、基于企业知识库的问答以及Chatdoc等工具应用。### **火山引擎****向... 对于工程师来讲,面对众多技术门槛较高的产品,要进行快速理解和判断,难度较大。解决方案就是,将火山知识库文档和数据通过向量特征提取,然后存储到向量数据库中,应用LLM大语言模型与向量化的知识库检索和比对知识,...

分布式数据库在抖音春晚活动中的应用

火山引擎系统开发工程师 分布式数据库架构简介 ![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/4880b517a7794b5bbfba24c6cbdf7121~tplv-... 上图是现有的或者主流的大型数据库系统的架构,它分为三层:* 最上一层是应用,今日头条,抖音,西瓜视频等都是应用。* 中间层是数据库中间件层。* 底层是数据库层以及数据库下面的单机存储。这个架构应该是比较...

一位老IT的2023年的技术总结 |社区征文

## 笔者介绍笔者介绍,近几年的工作内容都与数据库和大数据相关,公司的市场定位 为客户提供数据智能一体化的解决方案,笔者的工作主要围绕公司的旗舰产品做一些售前、售中、售后的事情 ,主要是DBA和技术支持。工作... 虽然学习了某些技术 ,熟悉了一些工具框架,但是搞的东西没有起色,没有实现自由财务,世界没有因为我的存在而进行改变。信息行业中存在哪些亟待解决的事情?从信息建设的方案的初衷出发,大概分为**信息系统建设方案...

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

抖音大规模实践,火山引擎向量数据库是这样炼成的

**向量数据库就是用于生产、存储、索引和分析来自机器学习模型产生的海量向量数据的数据库系统** 。其典型应用场景比如:基于大语言模型的智能客服、基于企业知识库的问答以及 Chatdoc 等工具应用。 ... 对于工程师来讲,面对众多技术门槛较高的产品,要进行快速理解和判断,难度较大。解决方案就是,将火山知识库文档和数据通过向量特征提取,然后存储到向量数据库中,应用 **LLM 大语言模型** 与 **向量化的知识库检...

数据库顶会 VLDB 2023 论文解读:字节跳动如何解决超大规模流式任务运维难题

1. 指标采集流式作业管控常用的指标信息除了计算引擎自身的指标外还有 MQ 侧的数据源相关指标和 K8s 侧的资源相关指标,字节跳动内部将三类指标都通过中心时序数据库缓存起来。StreamOps 对接了内部的时序数据库系统,管控策略就可以根据需要对不同种类的指标进行丰富的查询操作。![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/c5e9d70078594b55b47369b6d4f8abe7~tplv-tlddhu82om-image...

概述

数据开发工程师需要建立对应的数据服务,一般会有以下两个要求: 要求数据开发不仅仅是开发出数据表,还需要将数据表包装成一个独立的、灵活的、高可用的、安全的数据服务。 要求数据开发工程师,除了具备基本的业务需... 概括为: 服务创建能力: 面向数据库表的向导式和脚本式 Query。提供低代码快速构建 API,同时提供自定义的脚本模式创建 API,可以自助定义复杂的查询条件、聚合函数、判断逻辑等。 API 管理与运维能力: 支持 API 版本...

字节跳动在联邦学习领域的探索及实践

联邦学习(Federated Learning)是一种新的机器学习范式,它让多个参与者可以在不泄露明文数据的前提下,用多方的数据共同训练模型,实现数据可用不可见。 字节跳动联邦学习系统架构师解浚源近期在火山引擎智能增长技术... 广告主会将转化事件记录到数据库里面,媒体侧也会把这些信息记录到数据库里面。在该领域的传统做法是广告主将标签返回到媒体这一侧,然后媒体组合数据和标签用以训练模型,使用该模型知道投放优化效果。 在这个场景下...

干货|一套架构框架满足流批数据质量监控

字节跳动数据平台开发套件团队高级研发工程师DataLeap什么是数据质量管理 广义上来说,数据质量的定义是数据满足一组固有特性(质量维度)要求的程度。业界通常有 6 个维度: * ... 多出现在数据系统达到一定的复杂度后,同一指标会在多处进行计算,由于计算口径或者开发人员的不同,容易造成同一指标出现不同的结果。* **及时性**:在确保数据的完整性、准确性和一致性后,接下来就要保障数据能够...

克服 ClickHouse 运维难题:ByteHouse 水平扩容功能上线

# 前言对于分析型数据库产品,通过增加服务节点实现集群水平扩容,并提升集群性能和容量,是运维的必要手段。但是对于熟悉 ClickHouse 的工程师而言,听到“扩容”二字一定会头疼不已。开源 ClickHouse 的 MPP 架构导致扩容成本高,已是 ClickHouse 运维的核心痛点。主要体现在:- 流程全手动,无数据可靠性保证。- 扩容期间性能开销大,通常需要暂停服务。基于字节跳动内广泛的使用场景,ByteHouse 企业版基于开源社区 C...

特惠活动

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

从ClickHouse到ByteHouse
关于金融、工业互联网,都有对应的场景特性、解决策略、实践效果具体呈现,相信一定能解决你的诸多疑惑
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询