作业部落深度学习

机器学习平台

面向机器学习应用开发者，提供 WebIDE 和自定义训练等丰富建模工具、多框架高性能模型推理服务的企业级机器学习平台

社区干货

# 前言> 2023年马上就要结束了,这一年对于整个互联网来说意义非凡。随着深度学习技术的不断进步,大规模预训练语言模型(以下简称大模型)在自然语言处理领域取得了显著进展,从年初的OpenAI发布的最新版本的语言大模... 更何况一个公司开发团队由新人老人共同作业时各种沟通、编码习惯等差异,导致我们沟通成本、开发成本增多。所以国内外各AI都在无缝融入IDE,在这里仅以我使用过的VS Code的一款AI插件--Devchat做说明,仅个人使用体...

字节跳动 EB 级 Iceberg 数据湖的机器学习应用与优化

> 深度学习的模型规模越来越庞大,其训练数据量级也成倍增长,这对海量训练数据的存储方案也提出了更高的要求:怎样更高性能地读取训练样本、不使数据读取成为模型训练的瓶颈,怎样更高效地支持特征工程、更便捷地增删... 平台能力上支持多种运维作业,如数据导入、维护等任务。值得一提的是,该层引入了基于 Arrow 的高速向量化读时合并引擎,能够高效合并数据、提高读取性能。猛犸湖的底座是基于强化版的 Iceberg 元数据,元数据支持版本...

项目分享:AIGC 技术在智能教学生成中的应用 | 社区征文

# 前言伴随着科技的飞速发展,教育领域也正经历着一场前所未有的变革。特别是深度学习和AIGC技术的出现,为智能教学领域带来了新的机遇和挑战,通过与AI领域深度学习技术的结合,完成了一个智能教学助手项目。本文我... **智能评估与反馈**:使用深度学习模型对学生的作业进行自动批改和评估,减轻教师的负担,并为学生提供及时、准确的反馈。同时,这种评估方式还能挖掘学生的学习问题,帮助他们改进学习方法,以下是部分核心代码。```...

我与Stable Diffusion的“缘” 主赛道 | 社区征文

其成为AI行业从传统深度学习时代走向AIGC时代的标志性模型之一**,并为工业界,投资界,学术界以及竞赛界都注入了新的AI想象空间,**让AI再次性感**。在当时我对它的了解仅限于耳闻其名。要说我与Stable Diffusion的... 直接改写为分布式作业调度,来并行处理,针对于SD模型优化代码展示,请看模型压缩包中:```import numpy as npimport oneflow as flowimport oneflow.typing as tpBATCH_SIZE = 100def mlp(data): #构建网络...

特惠活动

2核4G共享型云服务器

Intel CPU 性能可靠，不限流量，学习测试、小型网站、小程序开发推荐，性价比首选

￥86.00/年1908.00/年

立即购买

2核4G计算型c1ie云服务器

Intel CPU 性能独享，不限流量，密集计算、官网建站、数据分析等、企业级应用推荐

￥541.11/年2705.57/年

立即购买

域名注册服务

cn/top/com等热门域名，首年低至1元，邮箱建站必选

￥1.00/首年起32.00/首年起

立即购买

作业部落深度学习-优选内容

AI 大模型探索 | 社区征文

字节跳动 EB 级 Iceberg 数据湖的机器学习应用与优化

项目分享:AIGC 技术在智能教学生成中的应用 | 社区征文

我与Stable Diffusion的“缘” 主赛道 | 社区征文

作业部落深度学习-相关内容

从混合部署到融合调度:字节跳动容器调度技术演进之路

机器学习和大数据服务。在线微服务是指支撑应用的业务逻辑、产品基础功能的后端服务,它包括接口、 RPC 后端服务、数据访问层服务等;推广搜服务是指为抖音、西瓜视频、懂车帝等 Feed 服务和搜索提供内容列表的... 数据面隔离等多方位的深度定制和改造的整体集合。字节跳动基础架构编排调度团队基于数据中心操作系统的视角构建了这一体系,实现整体性资源调度。打一个比方,假设对于一个单机操作系统,比如 Linux,我们需要在它...

字节跳动 Spark Shuffle 大规模云原生化演进实践

机器学习和大数据场景。目前中国区域内每天的任务数已经超过 150 万,每天的 Shuffle 读写数据量超过 500 PB。同时某些单个任务的 Shuffle 数据能够达到数百 TB 级别。与此同时作业量与 Shuffle 的数据量还在增长... 深度定制化后的 ESS 服务;使用 SSD 磁盘、ESS 读写,也可以使用本地的高性能 SSD 磁盘;部署在 Daemonset 模式,Gödel 架构下。- **混部****资源集群环境**。这些集群主要服务于中低游的作业,以一些临时查询、调试...

云原生大数据 Meetup|云原生时代下的数据计算基础设施

在分布式计算尤其是机器学习领域的应用越来越广泛。Ray 在字节跳动有比较广泛的应用,比如图计算、ML等,并基于云原生环境提供弹性作业能力。本次分享将从如下几个方面进行展开:- Ray 简介及优势- Ray 在字节跳动的应用场景- Kuberay 助力 Ray 云原生部署**《云原生场景下的存储加速实战》**郭俊|火山引擎大数据文件存储技术负责人云原生场景下,大数据和机器学习的计算架构朝着存算分离、弹性伸缩和灵活调度的方...

2核4G共享型云服务器

Intel CPU 性能可靠，不限流量，学习测试、小型网站、小程序开发推荐，性价比首选

￥86.00/年1908.00/年

立即购买

2核4G计算型c1ie云服务器

Intel CPU 性能独享，不限流量，密集计算、官网建站、数据分析等、企业级应用推荐

￥541.11/年2705.57/年

立即购买

域名注册服务

cn/top/com等热门域名，首年低至1元，邮箱建站必选

￥1.00/首年起32.00/首年起

立即购买

从100w核到450w核:字节跳动超大规模云原生离线训练实践

离线训练 Zion 框架是基于 Hadoop Streaming 架构在深度学习场景下的深度定制,每个训练作业对应一个 Hadoop YARN 上的 Zion 任务,具有(PS-Worker)架构分布式训练器、多数据格式多数据源混合训练、HDFS 样本读取、训练训练进度 Checkpoint 功能。(PS-Worker)架构分布式训练器基于 Google 的 Tensorflow 框架深度定制,主要采用 Worker-PS 架构进行训练。此架构分为 PS 端与 Worker 端两个部分——其中 PS(ParameterServer) 是参数...

基于 Ray 的大规模离线推理

大模型离线推理(Batch 推理)是指在具有数十亿至数千亿参数的大规模模型上进行分布式计算推理的过程,具有如下特点:1. 一次对一批数据进行推理,数据量通常是海量的,所以计算过程通常是离线计算;1. 推理作业执行... 第一个挑战是内存的挑战,机器学习的模型越来越大,尤其是继 Transformers 类的模型后,模型大小迅猛增长。从上图中可以看到,过去几年机器学习领域的模型参数增长非常迅猛,而相比于模型参数的增长,GPU 算力的提升相对...

人工智能与教育:机遇与挑战 | 社区征文

回应评定和反馈:人工智能适合于自动评定学生的学习成绩和表现。依据设备学习和自然语言理解技术的使用,人工智能可以分析学生的课外作业、评估和回答,并提供实时反馈和个性化的学习提议。这有利于学生了解他们的学习进展,并针对性地改善他的学习方式。- 虚似老师和指导:人工智能适合于开发虚似老师和指导系统。这个模式可以和学生交谈,解答问题,表述界定,并提供学习支持和指导。虚似教师可以提供 24/7 的学习应用软件,为其...

字节跳动正式开源分布式训练调度框架 Primus

如与固定的机器学习框架( Tensorflow,Pytorch )耦合需要写明例如 PS、Worker 等角色,容错和弹性调度支持不友好,不支持异构调度,调度语义较为简单,不支持文件读取等。****将算法工程师从此类繁重的底层细节中解脱出来、更多地关注到算法层面,即为 Primus 解决的问题。******日均作业百万核的字节跳动实践**经过字节跳动在不断实践中调整打磨的 Primus,拥有以下能力支撑业务需求: 1. 自研训练框架:...

干货|从数据治理看,如何打赢“双11”的数字化战争

高优作业:P1应用,INTEL+SSD计算队列(100%)**************************************************************●**************************************************************普通作业:P2应用,混部计算队列... 深度分析现状,通常以专项的形式进行数据治理;事后的治理一般需要深度治理,组织专项制定计划,主要针对存量任务,因此周期一般较长,收益也比较清晰。![picture.image](https://p3-volc-community-sign.byteimg.com...

字节跳动正式开源分布式训练调度框架 Primus

如与固定的机器学习框架( Tensorflow,Pytorch )耦合需要写明例如 PS、Worker 等角色,容错和弹性调度支持不友好,不支持异构调度,调度语义较为简单,不支持文件读取等。**将算法工程师从此类繁重的底层细节中解脱出来、更多地关注到算法层面,即为** **Primus** **解决的问题。** 日均作业百万核的字节跳动实践==============经过字节跳动在不断实践中调整打磨的 Primus,拥有以下能力支撑业务需求:1. 自研训练框架:目前...

特惠活动

2核4G共享型云服务器

Intel CPU 性能可靠，不限流量，学习测试、小型网站、小程序开发推荐，性价比首选

￥86.00/年1908.00/年

立即购买

2核4G计算型c1ie云服务器

Intel CPU 性能独享，不限流量，密集计算、官网建站、数据分析等、企业级应用推荐

￥541.11/年2705.57/年

立即购买

域名注册服务

cn/top/com等热门域名，首年低至1元，邮箱建站必选

￥1.00/首年起32.00/首年起

立即购买

产品体验

体验中心

云服务器特惠

云服务器

云服务器ECS新人特惠

立即抢购

白皮书

一图详解大模型

浓缩大模型架构，厘清生产和应用链路关系

立即获取

作业部落深度学习

机器学习平台

社区干货

AI 大模型探索 | 社区征文

字节跳动 EB 级 Iceberg 数据湖的机器学习应用与优化

项目分享:AIGC 技术在智能教学生成中的应用 | 社区征文

我与Stable Diffusion的“缘” 主赛道 | 社区征文

特惠活动

2核4G共享型云服务器

2核4G计算型c1ie云服务器

域名注册服务

作业部落深度学习-优选内容

作业部落深度学习-相关内容

从混合部署到融合调度:字节跳动容器调度技术演进之路

字节跳动 Spark Shuffle 大规模云原生化演进实践

云原生大数据 Meetup|云原生时代下的数据计算基础设施

2核4G共享型云服务器

2核4G计算型c1ie云服务器

域名注册服务

从100w核到450w核:字节跳动超大规模云原生离线训练实践

基于 Ray 的大规模离线推理

人工智能与教育:机遇与挑战 | 社区征文

字节跳动正式开源分布式训练调度框架 Primus

干货|从数据治理看,如何打赢“双11”的数字化战争

字节跳动正式开源分布式训练调度框架 Primus

特惠活动

2核4G共享型云服务器

2核4G计算型c1ie云服务器

域名注册服务

产品体验

体验中心

云服务器特惠

白皮书

相关主题

最新活动

爆款1核2G共享型服务器

火山引擎增长体验专区

数据智能VeDI

热门访问

一键开启云上增长新空间