You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

深度学习加速库

面向机器学习应用开发者,提供 WebIDE 和自定义训练等丰富建模工具、多框架高性能模型推理服务的企业级机器学习平台

社区干货

nvidia-cuda镜像

## 简介CUDA-X AI 是软件加速库的集合,这些库建立在 CUDA® (NVIDIA 的开创性并行编程模型)之上,提供对于深度学习、机器学习和高性能计算 (HPC) 必不可少的优化功能。下载地址:- 火山引擎访问地址:https://mirrors.ivolces.com/nvidia_all/- 公网访问地址:https://mirrors.volces.com/nvidia_all/## 相关链接官方主页:[https://www.nvidia.cn/technologies/cuda-x/](https://www.nvidia.cn/technologies/cuda-x/?spm=a...

我的深度学习项目经验分享|社区征文

AI的爆火在于它确实能促进整个社会中大多人群的学习工作和生活的效率的提升,这是非常实用的。我要和大家分享的项目也是我学习AI过程中做的小项目,是利用视频分析技术结合深度学习构建的一个智能视频监控系统,用来进... 这里我选用的是图像处理(如OpenCV)对视频流进行预处理,这些技术也已经非常成熟。视频还需要进行解码与帧的提取,这是为了方便后续的人脸检测和行为识别,使用了oneAPI加速工具对视频进行解码。人脸检测模块使用了O...

基于深度学习的工业缺陷检测详解——从0到1|社区征文

# beginning2023年可谓是人工智能浪潮翻涌的一年,AI在各个领域遍地开花。以我最熟悉的工业为例,深度学习也在其中起着重要作用。不知道小伙伴们熟不熟悉工业领域的缺陷检测腻?🧐🧐🧐今天就以钢轨表面缺陷为例,和大... 那什么是迁移学习腻?简单来说,迁移学习就是通过将已有任务的知识和模型应用到新任务中,从而加速新任务的学习过程。举个小例子:假设我们已经在一个大型图像数据集上训练了一个卷积神经网络来识别不同的动物。现在...

边缘计算技术:深度学习与人工智能的融合|社区征文

**边缘ML:** 是指机器学习在不处于核心数据中心的,企业级计算机/设备中的应用。边缘设备包括服务器机房,现场服务器,以及位于各个地区以加快响应速度为目的的小型数据中心。云端和边缘端的ML 已经通过3年多的科普,广为大众所接受。今天我们看到的人脸门禁、摄像头行为识别、智能音箱...... 绝大部分场景都属于这两类。 以 TensorFlow & TF lite 等开源深度学习框架为基础的大量应用,推动了智能在云端和边缘端应用。然而,更加具有...

特惠活动

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

2核4G计算型c1ie云服务器

Intel CPU 性能独享,不限流量,密集计算、官网建站、数据分析等、企业级应用推荐
541.11/2705.57/年
立即购买

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

深度学习加速库-优选内容

nvidia-cuda镜像
## 简介CUDA-X AI 是软件加速库的集合,这些库建立在 CUDA® (NVIDIA 的开创性并行编程模型)之上,提供对于深度学习、机器学习和高性能计算 (HPC) 必不可少的优化功能。下载地址:- 火山引擎访问地址:https://mirrors.ivolces.com/nvidia_all/- 公网访问地址:https://mirrors.volces.com/nvidia_all/## 相关链接官方主页:[https://www.nvidia.cn/technologies/cuda-x/](https://www.nvidia.cn/technologies/cuda-x/?spm=a...
搭建Llama-2-7b-hf模型进行推理
是Intel®推出的一种集体通信库,旨在为分布式深度学习训练提供高性能的通信支持。它提供了一组优化的通信算法和数据结构,可用于在分布式环境中实现高效的通信操作。 oneDNNoneDNN(oneAPI Deep Neural Network Library)是Intel®开发的一个深度学习加速库,旨在优化和加速深度学习模型的推理和训练。它提供了一系列高效的算法和优化,用于在英特尔处理器(CPU)、图形处理器(GPU)和其他硬件加速器上执行深度学习任务。 操作步骤步骤一...
GPU-部署NGC环境
NGC官网提供了当前主流深度学习框架的镜像,例如Caffe、TensorFlow、Theano、Torch等。 软件版本操作系统:本文以Ubuntu 18.04为例。 NVIDIA驱动:GPU驱动:用来驱动NVIDIA GPU卡的程序。本文以470.57.02为例。 CUDA:使GPU能够解决复杂计算问题的计算平台。本文以CUDA 11.4为例。 CUDNN:深度神经网络,用于实现高性能GPU加速。本文以8.2.4.15为例。 TensorFlow:深度学习框架。 前提条件您已购买Linux实例,并勾选“后台自动安装GPU驱...
斩获 IPDPS 2023 最佳论文奖
Microsoft DeepSpeed-Inference等知名的深度学习库相比,ByteTransformer在可变长输入下最高实现131%的加速。论文代码已开源。论文地址:https://arxiv.org/abs/2210.03052 IPDPS: 并行和分布式计算方向计算机系统领域的旗舰会议。该会议专注于分享并讨论并行计算、分布式计算、大规模数据处理以及高性能计算等相关领域的最新研究进展。参与的专家学者来自世界各地的顶尖研究机构和企业,共同探讨该领域的创新发展和前沿技术。 代码...

深度学习加速库-相关内容

GPU-使用Llama.cpp量化Llama2模型

CUDNN:深度神经网络,用于实现高性能GPU加速。本文以8.5.0.96为例。 运行环境: Transformers:一种神经网络架构,用于语言建模、文本生成和机器翻译等任务。深度学习框架。本文以4.30.2为例。 Pytorch:开源的Python机器学习库,实现强大的GPU加速的同时还支持动态神经网络。本文以2.0.1为例。 Python:执行Llama.cpp的某些脚本所需的版本。本文以Python 3.8为例。 使用说明下载本文所需软件需要访问国外网站,建议您增加网络...

GPU-部署Baichuan大语言模型

CUDNN:深度神经网络,用于实现高性能GPU加速。本文以8.5.0.96为例。 运行环境:Transformers:一种神经网络架构,用于语言建模、文本生成和机器翻译等任务。深度学习框架。本文以4.30.2为例。 Pytorch:开源的Python机器学习库,实现强大的GPU加速的同时还支持动态神经网络。本文以2.0.1为例。 Anaconda:获取包且对包能够进行管理的工具,包含了Conda、Python在内的超过180个科学包及其依赖项,用于创建Python虚拟环境。本文以Anacon...

基于深度学习的工业缺陷检测详解——从0到1|社区征文

# beginning2023年可谓是人工智能浪潮翻涌的一年,AI在各个领域遍地开花。以我最熟悉的工业为例,深度学习也在其中起着重要作用。不知道小伙伴们熟不熟悉工业领域的缺陷检测腻?🧐🧐🧐今天就以钢轨表面缺陷为例,和大... 那什么是迁移学习腻?简单来说,迁移学习就是通过将已有任务的知识和模型应用到新任务中,从而加速新任务的学习过程。举个小例子:假设我们已经在一个大型图像数据集上训练了一个卷积神经网络来识别不同的动物。现在...

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

2核4G计算型c1ie云服务器

Intel CPU 性能独享,不限流量,密集计算、官网建站、数据分析等、企业级应用推荐
541.11/2705.57/年
立即购买

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

边缘计算技术:深度学习与人工智能的融合|社区征文

**边缘ML:** 是指机器学习在不处于核心数据中心的,企业级计算机/设备中的应用。边缘设备包括服务器机房,现场服务器,以及位于各个地区以加快响应速度为目的的小型数据中心。云端和边缘端的ML 已经通过3年多的科普,广为大众所接受。今天我们看到的人脸门禁、摄像头行为识别、智能音箱...... 绝大部分场景都属于这两类。 以 TensorFlow & TF lite 等开源深度学习框架为基础的大量应用,推动了智能在云端和边缘端应用。然而,更加具有...

大模型:深度学习之旅与未来趋势|社区征文

这个大模型擅长的角度来验证大模型能否更深度提升个人工作效率。![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/348f356e262044e781fa8696ba0014ed~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1716222074&x-signature=1uV9v73OD9eu2WO%2FUA%2F24%2FHNKm4%3D)# 训练方法目前,模型加速领域已经建立了很多有影响力的开源工具,国际上比较有名的有微软DeepSpeed、英伟达Megatr...

字节跳动 EB 级 Iceberg 数据湖的机器学习应用与优化

> 深度学习的模型规模越来越庞大,其训练数据量级也成倍增长,这对海量训练数据的存储方案也提出了更高的要求:怎样更高性能地读取训练样本、不使数据读取成为模型训练的瓶颈,怎样更高效地支持特征工程、更便捷地增删和回填特征。本文将介绍字节跳动如何通过 Iceberg 数据湖支持 EB 级机器学习样本存储,实现高性能特征读取和高效特征调研、特征工程加速模型迭代。**相关产品**:https://www.volcengine.com/product/flink # 机...

veImageX演进之路:我用图像压缩算法为公司省了30%成本

**前言** 日前,第五届深度学习图像压缩挑战赛(以下将简称“ CLIC 大赛”)比赛结果公布,首次参赛的火山引擎视频云多媒体实验室夺得视频压缩赛道第一名。压缩技术对于图像、视频应用十分重要。在保证同样主观质... 而不需要集成客户端解码。相比于自研编码方式需要集成SDK之外,集智瘦身的接入简单很多,只需要将域名指向到veImageX服务就可以享受降本服务。**演进方式A** **:** 有些业务线在实际推进过程中虽然比较复杂,但...

AI安全技术总结与展望| 社区征文

对机器学习深度学习拥有自己独到的见解。今天给大家分享的是AI安全技术总结与展望,欢迎大家在评论区留言,和大家一起成长进步。  本文将从AI安全分类、AI安全应用、AI安全面临的威胁、AI安全事件、AI安全公司... 可通过机器学习自动识别可疑的行为,如删除、访问数据、移动等,从而及时采取防御或者处置措施,以防泄露重要的数据。机器学习还能对不同的数据进行分类,在更细粒度上识别风险,保护数据的安全。  近来来,人工智...

图像处理解决方案 veImageX 技术演进之路

> 作者|周强近日,第五届深度学习图像压缩挑战赛(以下将简称“ CLIC 大赛”)比赛结果公布,首次参赛的火山引擎视频云多媒体实验室夺得视频压缩赛道第一名。压缩技术对于图像、视频应用十分重要。在保证同样的质量前... 会存储到数据仓,供查询、监测图片的访问性能、错误率等指标使用。**网络分发**:在图片下载过程中,一般来说会首先访问 CDN 。若 CDN 未缓存,则会触发回源,请求由源站接入层转发到图片静图服务。该服务主要负责访...

特惠活动

2核4G共享型云服务器

Intel CPU 性能可靠,不限流量,学习测试、小型网站、小程序开发推荐,性价比首选
86.00/1908.00/年
立即购买

2核4G计算型c1ie云服务器

Intel CPU 性能独享,不限流量,密集计算、官网建站、数据分析等、企业级应用推荐
541.11/2705.57/年
立即购买

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

一图详解大模型
浓缩大模型架构,厘清生产和应用链路关系
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询