You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

分布式存储到对象存储的发展

基于先进分布式技术,帮助用户灵活高效、稳定可靠的存储并管理海量非结构化数据

社区干货

9年演进史:字节跳动 10EB 级大数据存储实战

作为目前字节跳动内部存储量及集群规模最大的分布式存储系统,HDFS 一直伴随着字节跳动关键业务的飞速扩张而快速发展。本文从 HDFS 发展历程入手,介绍发展路径上的重大挑战及解决方案。 ... **火山引擎大数据文件存储**正在免费公测中! **免费公测!** **火山引擎** **大数据文件存储**大数据文件存储是面向大数据和机器学习生态的统一文件存储。支持对接多云对象存储,并提供统一数据管理和数据缓...

火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0(上)

为云原生数据仓库发展,及企业数字化转型实战运用提供最新的参考和启迪。 以下为 ByteHouse 技术白皮书前两个版块摘录。# 1.ByteHouse 简介ByteHouse 是字节跳动自主研发的云原生数据仓库产品,在开源 Cli... 存储服务化**对数据存储层进行统一抽象,灵活采用 HDFS 分布式存储或 S3 等对象存储作为数据存储载体,最终实现存储服务化,便于解决存储扩展性、读写吞吐瓶颈问题、数据一致性问题,同时能大幅降低存储成本。此外...

火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0(中)

用来存储实际数据、索引等内容。 数据表的数据文件存储在远端的统一分布式存储系统中,与计算节点分离开来。底层存储系统可能会对应不同类型的分布式系统。例如 HDFS,Amazon S3, Google cloud storage,Azure blob storage,阿里云对象存储等等。 不同的分布式存储系统,例如 S3 和 HDFS 有很多不同的功能和不一样的性能,会影响到功能的设计和实现。例如 hdfs 不支持文件的 update, S3 object move 操作时重操作需要复制...

9年演进史:字节跳动 10EB 级大数据存储实战

以达到容错容灾的效果。每个副本在 Data Node 上都以文件的形式存储,元信息在启动时被加载到内存中。Data Node 会定时向 Name Node 做心跳汇报,并且周期性将自己所存储的副本信息汇报给 Name Node。这个过程对 Federation 中的每个集群都是独立完成的。在心跳汇报的返回结果中,会携带 Name Node 对 Data Node 下发的指令。例如,需要将某个副本拷贝到另外一台 Data Node,或者将某个副本删除等。## **发展阶段**在字节跳动,随...

特惠活动

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

视频云ImageX媒资存储50G

分布式存储,可靠性高,全链路图像服务
1.00/6月24.07/6月
立即购买

分布式存储到对象存储的发展-优选内容

什么是对象存储 TOS
火山引擎对象存储 TOS(Tinder Object Storage)是火山引擎提供的海量、安全、低成本、易用、高可靠、高可用的分布式存储服务。您可以通过 RESTful API 接口、SDK 和工具等多种形式使用火山引擎 TOS。通过网络,您可以在任何应用、任何时间、任何地点管理和访问火山引擎 TOS 上的数据。 产品优势规模海量 火山引擎 TOS 通过自研分布式对象存储技术,通过领先的架构与技术支持,目前内部部署对象存储机器万台规模,存储规模超过 EB。传...
对象存储-火山引擎
火山引擎对象存储是火山引擎提供的海量、安全、低成本、易用、高可靠、高可用的分布式存储服务。通过网络,您可以在任何应用、任何时间、任何地点管理和访问火山引擎对象存储上的数据
9年演进史:字节跳动 10EB 级大数据存储实战
作为目前字节跳动内部存储量及集群规模最大的分布式存储系统,HDFS 一直伴随着字节跳动关键业务的飞速扩张而快速发展。本文从 HDFS 发展历程入手,介绍发展路径上的重大挑战及解决方案。 ... **火山引擎大数据文件存储**正在免费公测中! **免费公测!** **火山引擎** **大数据文件存储**大数据文件存储是面向大数据和机器学习生态的统一文件存储。支持对接多云对象存储,并提供统一数据管理和数据缓...
存储概述
容器服务基于 Kubernetes 容器存储接口(CSI),融合火山引擎弹性快存储 EBS、文件存储 NAS、大数据文件存储 CloudFS 和对象存储 TOS 等,提供容器网络存储能力。本文主要介绍容器服务支持的存储类型和网络存储在各种场... 跨地域访问的高性价比云存储服务。 对象存储 TOS,提供海量、安全、低成本、易用、高可靠、高可用的分布式云存储服务。 大数据文件存储是火山引擎面向大数据和机器学习生态的文件存储和加速服务,支持标准的 HDFS 协...

分布式存储到对象存储的发展-相关内容

9年演进史:字节跳动 10EB 级大数据存储实战

以达到容错容灾的效果。每个副本在 Data Node 上都以文件的形式存储,元信息在启动时被加载到内存中。Data Node 会定时向 Name Node 做心跳汇报,并且周期性将自己所存储的副本信息汇报给 Name Node。这个过程对 Federation 中的每个集群都是独立完成的。在心跳汇报的返回结果中,会携带 Name Node 对 Data Node 下发的指令。例如,需要将某个副本拷贝到另外一台 Data Node,或者将某个副本删除等。## **发展阶段**在字节跳动,随...

策略模式 之 一键切换云存储方式|社区征文

我们需要去对应的云服务厂商开通对象存储服务,然后获取到`accessKey`、`accessKeySecret`、`endpoint`、`bucket`、`domainUrl`等必须的参数。> 因为这些信息基本是不会发生改变,所以我们可以将这些信息存储在配置文件中。> 除此之外我们还需要对文件上传进行配置,设置为最大文件为100MB```ymlserver: port: 8080spring: servlet: multipart: max-file-size: 100MB max-request-size: 100MBapplicat...

存储选型最佳实践

本节主要介绍使用容器服务(VKE)时如何选择存储(对象存储、文件存储、弹性快存储)类型以及选择时的注意事项。 存储说明不同的业务类型,需要选择不同的存储类型以匹配业务需要,以下内容将对火山引擎提供的存储类型的... 让您像使用本地存储一样使用云端存储系统。 共享访问:应用级别数据共享,企业级数据管理,实现多终端协同工作以及数据共享。 访问安全:丰富权限以及后端多重数据保护机制,保障数据访问整体安全性。 极致性能:分布式架...

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

视频云ImageX媒资存储50G

分布式存储,可靠性高,全链路图像服务
1.00/6月24.07/6月
立即购买

字节跳动高性能 Kubernetes 元信息存储方案探索与实践

存储系统,目前支撑着线上超过 20,000 节点的超大规模 Kubernetes 集群的稳定运行。项目地址:github.com/kubewharf/kubebrain分布式应用编排调度系统 Kubernetes 已经成为云原生应用基座的事实标准,但是其官方的稳定运行规模仅仅**局限在 5,000 节点**。这对于大部分的应用场景已经足够,但是对于百万规模机器节点的超大规模应用场景, Kubernetes 难以提供稳定的支撑。尤其随着“数字化””云原生化”的发展,全球...

分布式存储

本文介绍分布式存储客户端的故障配置参数。 ES 故障Index 关闭说明 当前故障仅支持 Elasticsearch 8.0 及以上 版本。 可注入目标: 集群中的中间件 主机中的中间件 故障参数: 参数 是否必填 说明 故障名称 是 故障的名称。 Host 是 数据库客户端的 IP。 端口 是 数据库客户端的端口号。 是否开启 SSL 是 选择是开启 SSL 验证。 是否需要用户名密码 是 选择是否需要输入账户和密码登录。选择是,则需要配置对应的用户名和密码。 用...

字节跳动湖平台在批计算和特征场景的实践

一般只存储抽取后的特征,而不存储原始特征* 将 HDFS 存储的特征交由字节自研的分布式框架( Primus )进行并发读取,并进行编码和解码操作,进而发送给训练器。* 由训练器对模型进行高效训练+ 如果模型训练效果符合... 对象存储层。图中可以看出,Iceberg 所处的层级和 Hudi,DeltaLake 等工具一样,都是表格式层:* 向上提供统一的操作 API* Iceberg 定义表元数据信息以及 API 接口,包括表字段信息、表文件组织形式、表索引信息、表...

火山引擎存储产品双月刊-2023年11&12月

火山引擎存储产品双月刊涵盖存储和中间件所有产品的新品发布、功能更新、最佳实践和平台最新活动等多个模块内容。每双月更新,欢迎查阅体验。> 【邀测】产品或功能暂未对全部用户开放,如需使用,请[提交工单](https://console.volcengine.com/workorder/create/)或联系客户经理申请。# 功能更新## 对象存储- [【邀测】数据透视](https://www.volcengine.com/docs/6349/1184041):支持通过数据透视功能统计总存储量、总对象...

火山引擎云存储选型指南 x 自动驾驶场景最佳实践

高扩展性的云存储服务。按照经典的划分方式, **云存储一般分为块、文件、对象三大类型** ,其中文件存储一般又分为通用文件存储 NAS、并行文件存储 PFS、大数据文件存储等。而对象存储经过多年的发展和演进,已经... **对象存储 TOS**TOS(Tinder Object Storage)是火山引擎提供的海量、安全、低成本、易用、高可靠、高可用的分布式云存储服务。用户可以通过网络在任何应用、任何时间、任何地点管理和访问火山引擎 TOS 上的数据...

JuiceFS 在火山引擎边缘计算的应用实践

为了解决在边缘渲染中遇到的存储问题,团队花了将近半年的时间开展了存储选型测试。最初,团队选择了公司内部的存储组件,从可持续性和性能上来说,都能比较好的满足我们的需求。但是落地到边缘场景,有两个具体的问题:- 首先,公司内部组件是为了中心机房设计的,对于物理机资源和数量是有要求的,边缘某些机房很难满足;- 其次,整个公司的存储组件都打包在一起,包括:对象存储、块存储、分布式存储、文件存储等,而边缘侧主要需要文件...

特惠活动

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

视频云ImageX媒资存储50G

分布式存储,可靠性高,全链路图像服务
1.00/6月24.07/6月
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

从ClickHouse到ByteHouse
关于金融、工业互联网,都有对应的场景特性、解决策略、实践效果具体呈现,相信一定能解决你的诸多疑惑
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询