You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

将数据存储在请求对象中

基于先进分布式技术,帮助用户灵活高效、稳定可靠的存储并管理海量非结构化数据

社区干货

9年演进史:字节跳动 10EB 级大数据存储实战

HDFS 平台在公司内部已经成长为总数十万台级别服务器的大平台,支持了 10 EB 级别的数据量。**当前在字节跳动,** **HDFS** **承载的主要业务如下:**- Hive,HBase,日志服务,Kafka 数据存储 - Yarn,Flink 的计... 社区版本并无这一层定义。在字节跳动的落地实践中,由于集群的节点过于庞大,我们需要非常多的 NameNode 实现联邦机制来接入不同上层业务的数据服务。但当 NameNode 数量也变得非常多了以后,用户请求的统一接入及...

字节跳动高性能 Kubernetes 元信息存储方案探索与实践

[picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/d69f1f96547c48039adb668787fa0578~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1716394863&x-signature=jM5fSVtPeVK7RRTgfV3ANC7oTYQ%3D)本文整理自 2022 年稀土开发者大会演讲,字节跳动云原生工程师薛英才分享了 基于分布式 KV 存储引擎的高性能 K8s 元数据存储项目 KubeBrain。KubeBrain 是字节跳动针对 Kubernete...

数据一致性离不开的checkpoint机制 |社区征文

为了保证读写的效率,一般我们都会通过异步的方式来写数据,即先把数据写入内存,返回请求结果,然后再将数据异步写入。但是如果异步写入之前,系统宕机,会导致内存数据丢失。 **(write back)** 当系统出现故障重启后,通常要对前面的操作进行**replay**。但是从头开始代价太高了,所以通过checkpoint来减少进行**replay**的操作数。**checkpiont机制**保证在某一时刻,系统运行所在的易失性存储数据与持久化存储数据保持完全同步,...

9年演进史:字节跳动 10EB 级大数据存储实战

**当前在字节跳动,** **HDFS** **承载的主要业务如下:*** Hive,HBase,日志服务,Kafka 数据存储* Yarn,Flink 的计算框架平台数据* Spark,MapReduce 的计算相关数据存储**02****字节跳... 社区版本并无这一层定义。在字节跳动的落地实践中,由于集群的节点过于庞大,我们需要非常多的 NameNode 实现联邦机制来接入不同上层业务的数据服务。但当 NameNode 数量也变得非常多了以后,用户请求的统一接入...

特惠活动

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

视频云ImageX媒资存储50G

分布式存储,可靠性高,全链路图像服务
1.00/6月24.07/6月
立即购买

将数据存储在请求对象中-优选内容

将 vePFS 数据定时备份到对象存储
本文介绍通过 tosutil 工具,将 vePFS 上的数据备份至对象存储 TOS 的流程及操作步骤。 适用场景保存在 vePFS 的训练的核心数据,对数据安全性要求比较高,需要把数据进行定期备份。 训练过程的 checkpoint 数据,定期同步到对象存储中,及时释放 vePFS 的存储空间。 前提条件ECS 和 TOS 带宽均满足备份需求。 不同规格的 ECS 实例的网络带宽不同,规格详情,请参见 ECS 规格说明。 TOS 带宽的约束限制,请参见约束限制。 已创建对...
读取云原生消息引擎 BMQ 数据写入对象存储 TOS
然后写入 TOS 。 流程介绍 准备数据源 BMQ Topic。您需要在云原生消息引擎控制台创建资源池、Topic 和 Consumer Group,并获取资源池接入点地址。 准备数据目的 TOS Bucket。您需要在对象存储控制台创建存储桶和文... 公共读写:任何人均可对公共读写权限的存储桶进行读写操作,同时产生流量费用。 在存储桶的文件列表页面,单击创建文件夹,然后设置文件夹名称并单击确定。对象存储 TOS 以扁平化结构存放文件,为方便分类管理,您可以...
9年演进史:字节跳动 10EB 级大数据存储实战
HDFS 平台在公司内部已经成长为总数十万台级别服务器的大平台,支持了 10 EB 级别的数据量。**当前在字节跳动,** **HDFS** **承载的主要业务如下:**- Hive,HBase,日志服务,Kafka 数据存储 - Yarn,Flink 的计... 社区版本并无这一层定义。在字节跳动的落地实践中,由于集群的节点过于庞大,我们需要非常多的 NameNode 实现联邦机制来接入不同上层业务的数据服务。但当 NameNode 数量也变得非常多了以后,用户请求的统一接入及...
字节跳动高性能 Kubernetes 元信息存储方案探索与实践
[picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/d69f1f96547c48039adb668787fa0578~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1716394863&x-signature=jM5fSVtPeVK7RRTgfV3ANC7oTYQ%3D)本文整理自 2022 年稀土开发者大会演讲,字节跳动云原生工程师薛英才分享了 基于分布式 KV 存储引擎的高性能 K8s 元数据存储项目 KubeBrain。KubeBrain 是字节跳动针对 Kubernete...

将数据存储在请求对象中-相关内容

实现 vePFS 与对象存储 TOS 之间数据流动

本文介绍如何实现文件存储 vePFS 与对象存储 TOS 之间的数据流动。 适用场景加载数据集场景(TOS->vePFS):数据集从 TOS 流动到 vePFS,用于数据清洗和 GPU 训练。 训练数据归档场景(vePFS->TOS):GPU 训练的 CheckPo... 数据流动流程 操作步骤拷贝对象存储文件至 vePFS本文以 Centos 系统的 ECS 实例为例,介绍如何将对象存储数据拷贝至 vePFS。 登录 ECS 实例。 执行以下命令,切换到 tmux,避免迁移过程会话断开。 bash tmux new...

Redis String 实现 ID 生成器,底层为啥用 SDS 存储数据?| 社区征文

用于存储登录后的用户信息,key = token,value = Java 对象序列化成 JSON 后的字符串。如下指令。```SET user:token:666 {"name": "码哥",“gender”: “M”,“city”:"shenzhen"}```接下来,我先带你深入了... 文叫做“简单动态字符串”。> MySQL:“搞 SDS 的目的是啥?”字符串使用最为广泛,我要保证能支持**丰富和高性能**的字符串操作函数,**能保存二进制数据**,同时还能**节省内存**占用。实现了你们领导平时经常...

云原生环境下的日志采集、存储、分析实践

无处不在,也是 IT系统大数据的关键来源。日志的种类和样式非常多,以在线教育系统为例,日志包括客户端日志、服务端日志。服务端日志又包括业务的运行/运维日志以及业务使用的云产品产生的日志。要管理诸多类型的日志,就需要一套统一的日志系统,对日志进行采集、加工、存储、查询、分析、可视化、告警以及消费投递,将日志的生命周期进行闭环。## Kubernetes 下日志采集的开源自建方案### 开源自建火山引擎早期为了快速上线业...

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

视频云ImageX媒资存储50G

分布式存储,可靠性高,全链路图像服务
1.00/6月24.07/6月
立即购买

Pulsar 在云原生消息引擎领域为何如此流行?| 社区征文

多机房跨区域数据复制,具有强一致性、高吞吐、低延时及高可扩展性等流数据存储特性。Pulsar 的关键特性如下: - 是下一代云原生分布式消息流平台。 - Pulsar 的单个实例原生支持多个集群,可跨机房在集群间无缝... 订阅者将无法收到这些消息。#### 3.4.3 Dead letter topic(死信主题)死信主题允许你在用户无法成功消费某些消息时使用新消息。在这种机制,无法使用的消息存储在单独的主题中,称为死信主题。你可以决定如何处理...

湖仓一体架构在 LAS 服务的探索与实践

提供字节跳动最佳实践的一站式 EB 级海量数据存储计算和交互分析能力,兼容 Spark、Presto 生态,帮助企业轻松构建智能实时湖仓。LAS 服务是什么?LAS 有哪些优化特性?本文将从基础概念、数据库内核特性优化、数据服... 相比起传统数据湖,湖仓一体架构支持原生的 ACID 能力,支持像 BI 分析、报表分析,机器学习和流式分析多种类型的计算范式,以及云上的对象存储和弹性计算能力。以上能力,让湖仓一体架构能够有效地去解决企业的对数据规...

技术新风向丨挖掘藏在小程序 Cookie 的秘密

# Cookie 可不是一般的“小甜饼”Cookie 直译过来其实是“小甜饼”。但是在互联网的世界,Cookie 是 Web 开发一种常用的数据存储、会话跟踪技术。![picture.image](https://p6-volc-community-sign.byteimg.... 开发者封装 request 请求,从接口响应中取出需要保存的值,保存在本地缓存 storage 中,每次接口请求时,再从 storage 中读取相关数据添加进请求 header 或 body 中,以此模拟 Cookie 的效果。````// 从接口响应中取...

使用 KubeRay 和 Kueue 在 Kubernetes 托管 Ray 工作负载

在 KubeCon CN 2023 的「 Open AI + 数据 | Open AI + Data」专题,火山引擎软件工程师胡元哲分享了《**使用** **KubeRay** **和 Kueue 在** **Kubernetes** **中托管** **Ray** **工作负载|Sailing Ray workload... 变成了一些在远程运行的对象,其计算过程会被异步调用并存储在 object store 中,最后通过 ray.get 来获取到本地。![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/1caca47b01...

云原生环境下的日志采集、存储、分析实践

无处不在,也是 IT系统大数据的关键来源。日志的种类和样式非常多,以在线教育系统为例,日志包括客户端日志、服务端日志。服务端日志又包括业务的运行/运维日志以及业务使用的云产品产生的日志。要管理诸多类型的日... 当日志存储达到一定周期,不再需要实时分析之后,用户可以把日志投递到成本更低的火山引擎对象存储服务,或者通过 Kafka 协议投递到其他云产品。如果用户有更高阶的分析需求,TLS 也支持把日志消费到实时计算、流式计...

由浅入深,揭秘企业级 OLAP 数据引擎 ByteHouse

> 更多技术交流、求职机会,欢迎关注**字节跳动数据平台微信公众号,回复【1】进入官方交流群**在字节跳动各产品线飞速成长的过程,对数据分析能力也提出了更高的要求,现有的主流数据分析产品都没办法完全满足业务要求。因此,字节跳动在 ClickHouse 引擎基础上重构了技术架构,实现了云原生环境的部署和运维管理、存储计算分离、多租户管理等能力,推出了云原生数据仓库 ByteHouse。我们可以从下面几个方面认识 ByteHouse:**极...

特惠活动

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

视频云ImageX媒资存储50G

分布式存储,可靠性高,全链路图像服务
1.00/6月24.07/6月
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

从ClickHouse到ByteHouse
关于金融、工业互联网,都有对应的场景特性、解决策略、实践效果具体呈现,相信一定能解决你的诸多疑惑
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询