应用层:平台应用采用安全框架,并严格遵守SDLC,将SecDevOps践行在应用全生命周期中;- 运维层:进行MSS持续性运维,对应用无论从外部探测到分布式链路最终,均进行安全可观测行施行;- 云平台层:重复利用云平台提供安全产品及能力,践行云平台安全最佳实践,保护云上资源及运维安全;- K8s层:利用K8s内置安全机制,配合业界主流安全工具平台进行安全检测,及时快速反馈反应;- 容器层:凭借腾讯云镜像安全能力,同时配合业界镜像安全扫描...
发现了一款新的分布式计算框架在处理复杂清洗逻辑时有着显著的优势。具体而言,我们引入了 Apache Flink,这是一个流式处理引擎,与传统的批处理方式相比,它具有更好的性能和实时性。通过将 Flink 引入我们的数据处理流程,我们不仅加速了数据清洗的过程,而且更好地支持了实时数据分析需求。这个案例突显了技术深度的重要性,因为我需要深入了解新技术的原理和使用方法。同时,它也强调了技术广度,因为我不仅仅使用了一种解决方案,...
可以把一些常见但是又复杂的事情交给底层的 Calcite 框架来做,比如 SQL 的解析、校验、优化等。由此,我开始逐渐接触到 Apache Calcite。我发现 Apache Calcite 属于比较典型的 “纯技术社区”,也就是没有商... Calcite 项目被众多重量级的 Apache 项目用来实现 SQL 引擎的能力,比如 Apache Beam / Druid / Hive / Kylin / Flink / Drill / Phoenix 等,当然也包括一些商业产品。而我也在对 Flink SQL 进行更深度的优化的时候...
目标与策略,确保有体系、有目标地开展开源工作。+ 明确开源项目评审标准:筛选聚焦出高价值的重点项目,确保重点开源项目的资源支持与效果产出。+ 强化开源管理规范:优化审批流程,确保使用 / 贡献 / 自研开源等各类... 存储计算分离的数仓引擎 **ByConity** ,高性能 transformer 加速引擎 **lightseq** ,分布式深度学习通信框架 **BytePS** ,云原生项目合集 **KubeWharf** 等。今年字节在 AI/ML 编译器、隐私计算等领域也会有重...
**火山引擎云原生团队**——还在一遍遍校对着,见证一个个数据被写进抖音《2021 春晚数据报告》。这是这个团队第一次正面应对春晚的“流量大考”。他们见证了春晚互动数据的再一次打破纪录,也获得了春晚互动零卡顿、零宕机的佳绩。 27 天的技术奇迹 官宣成为央视《春节联欢晚会》独家互动合作伙伴,对字节跳动内部的各个团队来说,都意味着业界的信任和新的技术挑战: * 1 月 15 日,抖音...
甚至可以将过程简化为在待调研的原始特征中往一张样本表格里加列的操作后利用深度学习框架自动学习和提取信息。 总体来说字节跳动的机器学习和训练样本在其业务中发挥着重要作用。通过建立强大的训练平台、积... 天然支持 Flink 和 Spark 引擎进行数据分析和 ETL 数据处理,同时还支持多种训练框架,包括我们团队近期开源的分布式训练调度框架 Primus,以及传统的 PyTorch 和 TensorFlow 等,用户可以根据需求选择适合的计算、训练...
飞连动态控制引擎提供了多种风险定义参数和事件处置策略,帮助企业管理员轻松构建更适合自身业务场景的办公安全管理框架。一方面,通过数据聚合分析提高了风险识别准确性;另一方面,通过模块间的联动处置落实了企业办公安全管理制度。例如,当终端设备存在病毒时,飞连可以自动降级或禁止网络连接与应用访问权限,还可以解决锁屏密码、弱口令、连接不安全 Wi-Fi 等管理难题。 针对企业办公网络,飞连践行了永不信任、持续验证的零信任安...
引擎平台标签,用于搜索、管理 ECS 实例。 保持默认配置(为空) 系统配置 系统镜像 选择节点使用的系统镜像。 保持默认配置 系统云盘 提供操作系统运行、日志存储相关工作需要使用的存储空间。 保持默认配置 数据盘 提供额外存储空间,可用于日常工作中的数据存储。 保持默认配置 安全配置 安全组 为同一个私有网络内具有相同安全保护需求并相互信任的网卡提供访问策略。创建集群时容器服务会自动创建并绑定默认安全组,您也可以在默...
火山引擎为贝瑞基因提供弹性灵活的云端算力、大容量高性能存储及各类工具支持。基于可靠的云计算能力打造快速、全面的基因测序服务。 疫情带来了很多挑战,很多人都需要进行居家办公,这种混合办公的模式已经成为一种新常态。那么如何让企业保持混合办公效率,同时解决安全、身份和信息安全问题呢? 火山引擎飞连高效地协助小米构建了新办公安全体系,助力小米零信任建设规划的顺利落地。在双方的合作中,仅仅6小时就高效完成了新办公...
主要利用Wherehows的存储设计和ETL框架,自研实现前后端的功能模块。随着字节跳动业务的快速发展, 公司内各类存储引擎不断引入,数据生产者和消费者的痛点都日益明显。之前系统的设计问题,也到了需要解决的阶段。... 计算引擎的技术与业务元数据。+ 数据消费者: 各种引擎之间找数难,元数据的业务解释零散造成理解数难,难以信任。* **技术痛点:**+ 扩展性:新接入一类元数据时,整套系统伤筋动骨,开发成本月级别。+ 可维护性:经...
字节跳动 AML 团队内部开发了火山引擎大模型训练框架 veGiantModel。基于 PyTorch 框架,veGiantModel 是以 Megatron 和 DeepSpeed 为基础的高性能大模型训练框架。其特点包括:- 同时支持数据并行、算子切分、流水线并行 3 种分布式并行策略,同时支持自动化和定制化的并行策略- 基于 ByteCCL 高性能异步通讯库,训练任务吞吐相比其他开源框架有 1.2x-3.5x 的提升- 提供了更友好、灵活的流水线支持,降低了模型开发迭代所...
向量检索也早已在OLAP引擎中应用,用来提升非结构化数据的分析和检索能力。ByteHouse是火山引擎推出的云原生数据仓库,近期推出高性能向量检索能力,本篇将结合ByteHouse团队对向量数据库行业和技术的前沿观察,详细解... 查询上也在不断添加前后置过滤等复杂查询策略的支持。第二种构建思路是数据库加向量检索扩展,继续去支持更多的向量检索算法,并且不断按照向量检索的需求,添加特殊的过滤策略、简化对应的执行计划。以上两种构建...
火山引擎DataLeap提出了分布式数据自治的思路。首先,在业务影响方面,为保证影响小,治理工作按照业务单元进行。一个业务单元可能是一个小团队或者小项目。第二,沉淀各业务线治理经验,提升治理效率。* 通过产品辅助业务自驱,实现规则化、策略化、自动化治理。* 通过低门槛、算法推荐等平台能力,降低治理门槛。* 支持灵活的治理方式,如管理者视角,自上而下规划性治理;如一线执行者视角,自下而上推动治理。第三,适配...