底层芯片采用国内主流ARM路线的CPU;- 操作系统采用国产Kylin操作系统;- 数据库采用国产分布式数据库,QianBase;QianBase是基于Trafodion架构。Trafodion是HP公司资助的一个开源项目。它提供了一个成熟的企业级SQL on HBase解决方案。Trafodion的主要设计思想是处理operational类型的工作负载,或者是传统的OLTP应用。2006年,NonStop SQL的OLAP分支Neoview诞生,而Trafodion直接继承于Neoview和其后续产品SeaQuest。SeaQuest将N...
易扩展,容错率高## HDFS 在字节跳动的发展字节跳动已经应用 HDFS 非常长的时间了。经历了 9 年的发展,目前已直接支持了十多种数据平台,间接支持了上百种业务发展。从集群规模和数据量来说,HDFS 平台在公司内部已经成长为总数十万台级别服务器的大平台,支持了 10 EB 级别的数据量。**当前在字节跳动,** **HDFS** **承载的主要业务如下:**- Hive,HBase,日志服务,Kafka 数据存储 - Yarn,Flink 的计算框架平台数据 -...
## 笔者介绍笔者介绍,近几年的工作内容都与数据库和大数据相关,公司的市场定位 为客户提供数据智能一体化的解决方案,笔者的工作主要围绕公司的旗舰产品做一些售前、售中、售后的事情 ,主要是DBA和技术支持。工作... **信息系统建设方案:** 传统的应用建设,主要是单条业务流程整合,包括企业流程制度、企业控制管理、员工权限授权访问,常说的烟囱系统建设以及企业信息系统以及ERP、CRM、OA、交易系统、分析系统都属于这个范畴,信息...
目前已直接支持了十多种数据平台,间接支持了上百种业务发展。从集群规模和数据量来说,HDFS 平台在公司内部已经成长为总数十万台级别服务器的大平台,支持了 10 EB 级别的数据量。---------------------------------------------------------------------------------------------------------------------------- **当前在字节跳动,** **HDFS** **承载的主要业务如下:*** Hive,HBase,日志服务,Kafka 数据存储* Yarn,F...
广泛应用于以互联网业务为代表的场景。NoSQL 数据库又可以**细分为 KV 型 NoSQL 数据库(以 Redis 为代表)、文档型 NoSQL 数据库(以 MongoDB 为代表)、宽列型 NoSQL 数据库(以 HBase 为代表)、时序型 NoSQL 数据库(以 InfluxDB 为代表)以及图 NoSQL 数据库(以 Neo4j 为代表)**。虽然这些类型都属于 NoSQL 数据库范畴,但是不同类型的 NoSQL 数据库所适用的场景各有不同,需要根据业务特征选择合适的 NoSQL 数据库。其中 KV 型 NoS...
我们公司的技术团队在面向于云原生方向做了很多方面的变革和优化以及针对于技术方向的选取做了相关的调整,如下图所示,我梳理了整体的全盘计划。![](https://p3-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/d4d7aad6... 是一个开源的企业级多集群Kubernetes管理平台,实现了Kubernetes集群在混合云+本地数据中心的集中部署与管理,以确保集群的安全性,加速企业数字化转型。###### 中文官网首页(最新)![](https://p3-juejin.byteimg...
公司应用侧容器数量从 5 万个增长到了 750 万个,截至目前已经突破 **1000 万** 。这 1000 万个容器筑成了字节跳动坚实的云原生基础设施,支撑着整个业务体系的发展。从在线数据角度看,1000 万个容器构成了超过 ... 加之商业化数据库和存储带来的巨大成本使企业难以承受,以 NoSQL 和 BigData 为代表的数据库革命正式爆发,无论是 Google 开源的 HDFS、Bigtable,还是 HBase、MongoDB,它们都旨在解决 OLTP 型数据库吞吐量、扩展性不...
越来越多的公司将Flink作为首选的大数据计算引擎。字节跳动也在持续探索Flink,作为众多Flink用户中的一员,对于Flink的投入也是逐年增加。DataLeap 字节跳动数据集成的现状 在2018年,我们基于Flink构造了异构数据源之间批式同步通道,主要用于将在线数据库导入到离线数仓,和不同数据源之间的批式传输。在2020年,我们基于Flink构造了MQ-Hive的实时数据集成通道,主要用于将消息队列中的数据实...
指标平台支持 HBase 数据源创建模型绑定 - 数据地图支持 GaussDB 元数据采集 - 数据安全新增审计日志功能- **【** **公有云** **-功能迭代更新】** - 数据开发:新增 EMR Doris、E... 优化用户体验(灰度发布) - [云数仓版 SaaS] 支持 AWS Glue (ETL),支持导出到 AWS S3 - [云数仓版 SaaS] 完成与 ClickHouse PHP driver 兼容- **【** **ByteHouse** **企业版 新增功能** **】**...
公司应用侧容器数量从 5 万个增长到了 750 万个,截至目前已经突破 1000 万。这 1000 万个容器筑成了字节跳动坚实的云原生基础设施,支撑着整个业务体系的发展。从在线数据角度看,1000 万个容器构成了超过 10 万个... 加之商业化数据库和存储带来的巨大成本使企业难以承受,以 NoSQL 和 BigData 为代表的数据库革命正式爆发,无论是 Google 开源的 HDFS、Bigtable,还是 HBase、MongoDB,它们都旨在解决 OLTP 型数据库吞吐量、扩展性不...
本文是字节跳动数据平台开发套件团队在 Flink Forward Asia 2021: Flink Forward 峰会上的演讲,着重分享了字节跳动数据湖技术上的选型思考和探索实践。 作者|Gary Li,字节跳动数据平台开发套件团队高级研发工程师,数据湖开源项目 Apache Hudi PMC Member随着 Flink 社区的不断发展,越来越多的公司将 Flink 作为首选的大数据计算引擎。字节跳动也在持续探索 Flink,作为众多 Flink 用户中的一员,对于 Flink 的...
火山引擎 EMR 的架构及特点,以及如何基于火山引擎 EMR 构建企业级数据湖仓。> > > > ![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/30b32a0f0ce147fbbd5a9b... 现在业界已经有基于 Table Format 应用的经验、案例或者商业公司,比如 Data Bricks、基于 Iceberg 的 Tabluar以及基于 Hudi 的 OneHouse 公司。通过这些公司的商业产品,底层组件、运维和优化都交由商业产品解决...
### **云原生数据仓库ByteHouse**- **【新增ByteHouse云数仓版功能】** - ByteHouse 云数仓开通 AWS us-east-1 美东地域,助力国内出海企业更好的发展业务。 - 支持 Lambda 和 Python UDF,允许用户... HBase 的必选组件;Impala、Kudu、ClickHouse、Doris、StarRocks 等服务的核心指标接入监控和告警管理;HBase 中的表支持 Snappy 压缩;Hive,组件行为与开源保持一致,不再支持中文的表字段名;Doris,版本升级至1.1.5;H...