You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

字节跳动对象存储

基于先进分布式技术,帮助用户灵活高效、稳定可靠的存储并管理海量非结构化数据

社区干货

字节跳动极高可用 KV 存储系统详解

字节跳动研发工程师整理|张德通来源|DataFun Abase 简介 Abase 是什么?Abase 最初用作字节跳动在线推荐的底层存储。![picture.image](https://p6-volc-communit... 字节跳动研发工程师**,多年存储领域的开发经验,从 0 到 1 完成了多个存储系统从设计开发、到大规模使用取得收益的经历。曾在百度参与 KV 和对象存储系统的开发。2020 年加入字节跳动,主导字节跳动高可用 KV 存储系...

后 Hadoop 时代,字节跳动如何打造云原生计算平台

对象存储也取代了一部分 HDFS 文件系统。近几年,云原生又火了起来,行业里再次开始了对大数据体系的云原生改造,同时 Kubernetes(K8s) 的流行,也让同为资源管理的 YARN 地位越来越尴尬。然而,过去的技术体系在很多企业系统里仍发挥着很重要的作用,在技术更新迭代的时候,业务不能随意变动,那么我们在新旧技术共存的条件下,如何发挥新技术的最大潜力?字节跳动成立于 2012 年,也是大数据崛起之时,跟众多中小企业一样, **字节跳...

大象在云端起舞:后 Hadoop 时代的字节跳动云原生计算平台

对象存储也取代了一部分 HDFS 文件系统。近几年,云原生又火了起来,行业里再次开始了对大数据体系的云原生改造,同时 K8s 的流行,也让同为资源管理的 YARN 地位越来越尴尬。然而,过去的技术体系在很多企业系统里仍发挥着很重要的作用,在技术更新迭代的时候,业务不能随意变动,那么我们在新旧技术共存的条件下,如何发挥新技术的最大潜力?字节跳动成立于2012年,也是大数据崛起之时,跟众多中小企业一样,字节跳动也是 Hadoop 生态组...

大象在云端起舞:后 Hadoop 时代的字节跳动云原生计算平台

对象存储也取代了一部分 HDFS 文件系统。近几年,云原生又火了起来,行业里再次开始了对大数据体系的云原生改造,同时 K8s 的流行,也让同为资源管理的 YARN 地位越来越尴尬。然而,过去的技术体系在很多企业系统里仍发挥着很重要的作用,在技术更新迭代的时候,业务不能随意变动,那么我们在新旧技术共存的条件下,如何发挥新技术的最大潜力?字节跳动成立于2012年,也是大数据崛起之时,跟众多中小企业一样,字节跳动也是 Hadoop 生态...

特惠活动

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

视频云ImageX媒资存储50G

分布式存储,可靠性高,全链路图像服务
1.00/6月24.07/6月
立即购买

字节跳动对象存储-优选内容

字节跳动极高可用 KV 存储系统详解
字节跳动研发工程师整理|张德通来源|DataFun Abase 简介 Abase 是什么?Abase 最初用作字节跳动在线推荐的底层存储。![picture.image](https://p6-volc-communit... 字节跳动研发工程师**,多年存储领域的开发经验,从 0 到 1 完成了多个存储系统从设计开发、到大规模使用取得收益的经历。曾在百度参与 KV 和对象存储系统的开发。2020 年加入字节跳动,主导字节跳动高可用 KV 存储系...
后 Hadoop 时代,字节跳动如何打造云原生计算平台
对象存储也取代了一部分 HDFS 文件系统。近几年,云原生又火了起来,行业里再次开始了对大数据体系的云原生改造,同时 Kubernetes(K8s) 的流行,也让同为资源管理的 YARN 地位越来越尴尬。然而,过去的技术体系在很多企业系统里仍发挥着很重要的作用,在技术更新迭代的时候,业务不能随意变动,那么我们在新旧技术共存的条件下,如何发挥新技术的最大潜力?字节跳动成立于 2012 年,也是大数据崛起之时,跟众多中小企业一样, **字节跳...
大象在云端起舞:后 Hadoop 时代的字节跳动云原生计算平台
对象存储也取代了一部分 HDFS 文件系统。近几年,云原生又火了起来,行业里再次开始了对大数据体系的云原生改造,同时 K8s 的流行,也让同为资源管理的 YARN 地位越来越尴尬。然而,过去的技术体系在很多企业系统里仍发挥着很重要的作用,在技术更新迭代的时候,业务不能随意变动,那么我们在新旧技术共存的条件下,如何发挥新技术的最大潜力?字节跳动成立于2012年,也是大数据崛起之时,跟众多中小企业一样,字节跳动也是 Hadoop 生态组...
大象在云端起舞:后 Hadoop 时代的字节跳动云原生计算平台
对象存储也取代了一部分 HDFS 文件系统。近几年,云原生又火了起来,行业里再次开始了对大数据体系的云原生改造,同时 K8s 的流行,也让同为资源管理的 YARN 地位越来越尴尬。然而,过去的技术体系在很多企业系统里仍发挥着很重要的作用,在技术更新迭代的时候,业务不能随意变动,那么我们在新旧技术共存的条件下,如何发挥新技术的最大潜力?字节跳动成立于2012年,也是大数据崛起之时,跟众多中小企业一样,字节跳动也是 Hadoop 生态...

字节跳动对象存储-相关内容

字节跳动基于 Iceberg 的海量特征存储实践

[picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/30acb2cfeb2c402a966fd113ce83600b~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1714148439&x-signature=n6htYVVPdklDUYwUfLnn2mTuYUs%3D) 背景 **字节跳动特征存储痛点**当前行业内的特征存储整体流程主要分为以下四步:![picture.image](https://p6-volc-community-sign.bytei...

字节跳动基于 Iceberg 的海量特征存储实践

**01****背景** **字节跳动特征存储痛点**当前行业内的特征存储整体流程主要分为以下四步:![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/06a3ebbaac7341c79eca9f43a3d99253~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1714148436&x-signature=S2tda3%2F5rYu5V1XryaZcnDsqcZI%3D)特征存储的整体流程1. 业务...

字节跳动湖平台在批计算和特征场景的实践

> 本文整理自火山引擎云原生计算研发工程师刘纬在 DataFunCon 2022 上的演讲。随着业务的发展,字节跳动特征存储已到达 EB 级别,日均增量 PB 级别,每天训练资源量级为百万 Core。随之而来的是内部业务方对原始数据存... 对象存储层。图中可以看出,Iceberg 所处的层级和 Hudi,DeltaLake 等工具一样,都是表格式层:- 向上提供统一的操作 API- Iceberg 定义表元数据信息以及 API 接口,包括表字段信息、表文件组织形式、表索引信息...

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

视频云ImageX媒资存储50G

分布式存储,可靠性高,全链路图像服务
1.00/6月24.07/6月
立即购买

9年演进史:字节跳动 10EB 级大数据存储实战

易扩展,容错率高## HDFS 在字节跳动的发展字节跳动已经应用 HDFS 非常长的时间了。经历了 9 年的发展,目前已直接支持了十多种数据平台,间接支持了上百种业务发展。从集群规模和数据量来说,HDFS 平台在公司... Name Node 负责存储整个 HDFS 集群的元数据信息,是整个系统的大脑。一旦故障,整个集群都会陷入不可用状态。因此 Name Node 有一套基于 ZKFC 的主从热备的高可用方案。Name Node 还面临着扩展性的问题,单机承载能...

字节跳动湖平台在批计算和特征场景的实践

字节跳动特征存储已到达 EB 级别,日均增量 PB 级别,每天训练资源量级为百万 Core。随之而来的是内部业务方对原始数据存储、特征回填需求、降低成本、提升速度等需求的期待。本次分享将围绕问题背景、选型& Iceberg... 对象存储层。图中可以看出,Iceberg 所处的层级和 Hudi,DeltaLake 等工具一样,都是表格式层:* 向上提供统一的操作 API* Iceberg 定义表元数据信息以及 API 接口,包括表字段信息、表文件组织形式、表索引信息、表...

字节跳动基于 Iceberg 的海量特征存储实践

4. 训练器负责高速训练。![]()字节跳动特征**存储总量为 EB 级别**,每天的**增量达到 PB 级别**,并且每天用于训练的资源也达到了**百万核心**,所以整体上字节存储和计算的体量都是非常大的。在如此的体量之下,我们遇到了以下三大痛点:![02.png](https://p6-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/f6c6aa526f6841ca967f5e564e04c3da~tplv-k3u1fbpfcp-5.jpeg?)1. **特征抽取周期长。** 在特征抽取上,当前采用的是在线...

字节跳动高性能 Kubernetes 元信息存储方案探索与实践

字节跳动云原生工程师薛英才分享了 基于分布式 KV 存储引擎的高性能 K8s 元数据存储项目 KubeBrain。KubeBrain 是字节跳动针对 Kubernetes 元信息存储的使用需求,基于分布式 KV 存储引擎设计并实现的、可以... 且每个对象数据都是有唯一的索引记录最新的版本号,通过索引实现锁操作;* 可以很容易地构造出某行、某条索引所对应的 Key,或者是某一块相邻的行、相邻的索引值所对应的 Key 范围;* 由于 Key 的格式非单调递增...

字节跳动数据库的过去、现状与未来

而在字节跳动内部,数据库建设主要面临三大挑战:**业务种类繁多。** 以抖音为例,为了管理用户之间复杂的社交关系,同时根据用户点赞、关注等行为进行智能推荐,我们需要用图进行管理。再如抖音电商商城设计订单、库存等数据,这些信息适合用关系型结构化的结构表达。除此之外抖音还存在大量结构化和非结构化数据,如用户上传的图片、视频,这些信息适合用云存储对象存储这样的系统来管理。**业务增速快,诉求不断变化。** 如上图所...

字节跳动 EB 级 Iceberg 数据湖的机器学习应用与优化

本文将介绍字节跳动如何通过 Iceberg 数据湖支持 EB 级机器学习样本存储,实现高性能特征读取和高效特征调研、特征工程加速模型迭代。**相关产品**:https://www.volcengine.com/product/flink # 机器学习样本... 传统样本存储是将样本**直接存放在** ******HDFS** **、对象存储或者** ******Hive** ******上的方案**。这种方案在处理海量样本时会遇到性能瓶颈。由于采用了单点 List 操作,扫描海量样本时会变得非常缓慢。另外,...

特惠活动

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

视频云ImageX媒资存储50G

分布式存储,可靠性高,全链路图像服务
1.00/6月24.07/6月
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

从ClickHouse到ByteHouse
关于金融、工业互联网,都有对应的场景特性、解决策略、实践效果具体呈现,相信一定能解决你的诸多疑惑
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询