# 引言AI爆火的2023年,也是我开始学习AI的第一年,从后端领域向AI领域发展也是一个不错的选择。是什么原因让我觉得AI领域更值得钻研和发展呢?其实之前的文章也能体现出来,AI的爆火在于它确实能促进整个社会中大多人群的学习工作和生活的效率的提升,这是非常实用的。我要和大家分享的项目也是我学习AI过程中做的小项目,是利用视频分析技术结合深度学习构建的一个智能视频监控系统,用来进行实时监测和分析人员活动,提供监测识别和...
# beginning2023年可谓是人工智能浪潮翻涌的一年,AI在各个领域遍地开花。以我最熟悉的工业为例,深度学习也在其中起着重要作用。不知道小伙伴们熟不熟悉工业领域的缺陷检测腻?🧐🧐🧐今天就以钢轨表面缺陷为例,和大... 大规模分布式模型训练服务,同时支持模型在智能终端、边缘计算和云端的部署应用。在这里使用的是ModerArts自动学习功能里面的目标检测模块。只需要把数据、标注上传上去,点击自动训练,它就会自动根据训练数据集进行...
负责协调及管理系统的运行。# 3.边缘计算的特点低延迟:由于系统边缘的数据处理和应用逻辑,能够降低传送数据位置和时长,从而减少了延迟。这对需要实时反馈的应用场景(如自动驾驶、远程医疗等)至关重要。高效:边缘计算能彻底解决海量信息,减轻云计算核心压力,提高总体数据处理效率。灵活性:因为设备层和边缘服务器层分布式特点,边缘计算可以灵活地满足不同主要用途与需求。可靠性:由于数据在设备边缘的处理与应用,减少了...
系统会自动抓取数据,根据我们描述的指令进行创作。**图像创作**技术平台降低了艺术绘画创作的门槛,用户只需要通过输入文字描述,计算机将会自动生成一张作品。**视频创作**例如 Google 推出了 AI 视频生成模型... 其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为 AIGC 发展的“加速度”。# “智能诗歌生成”的AIGC项目我曾参与了一个名为“智能诗歌生成”的AIGC项目。该项目的主要目标是利用人工智...
分布式操作系统,成为云原生领域备受瞩目的开源项目。它以一组云原生组件为基础,专注于提升系统的可扩展性、功能性、稳定性、可观测性以及安全性,以满足大规模多租集群、离线混部、云原生存储和机器学习等多样化场景... 系统的可扩展性,使其成为管理大规模多租集群的理想选择。在当今云原生时代,许多企业面临着庞大的服务规模和多元化的应用负载。KubeWharf通过与Kubernetes的深度集成,为用户提供了更灵活和高效的资源管理方式,使其能...
**边缘ML:** 是指机器学习在不处于核心数据中心的,企业级计算机/设备中的应用。边缘设备包括服务器机房,现场服务器,以及位于各个地区以加快响应速度为目的的小型数据中心。云端和边缘端的ML 已经通过3年多的科普,广为大众所接受。今天我们看到的人脸门禁、摄像头行为识别、智能音箱...... 绝大部分场景都属于这两类。 以 TensorFlow & TF lite 等开源深度学习框架为基础的大量应用,推动了智能在云端和边缘端应用。然而,更加具有...
越来越多的技术:深度学习、AI、大模型、虚拟现实VR等慢慢进入我们的生活。**基于大模型的图像去雾**在今年这个阶段,我的主要工作是研究基于深度学习的图像去雾工作。随着现代工业文明的发展进步,大气污染现象愈发严重,由此产生的雾霾天气困扰着人们的出行和工作。雾霾是导致图像模糊的最主要原因之一,受雾霾天气影响,专业的监控和遥感成像系统所拍摄的图像也无法满足相应的工作需求,并且也会有一些烟、尘、雾等漂浮颗粒影响室...
# 前言从去年chatGPT爆火,到国内千模大战,关乎大模型的热度已经沸反盈天。但大模型出现的价值、意义似乎与实际使用效果存在鲜明的对比,特别是日常工作中,最多让大模型帮助生成一些不痛不痒、凑字数的内容,难易触达工作的核心环节。所以趁着国庆假期,我试图用国产大模型来协助完成一篇文章,从“知识生产”这个大模型擅长的角度来验证大模型能否更深度提升个人工作效率。![picture.image](https://p6-volc-community-sign.byte...
**前言**探地雷达(GPR)是一种广泛应用于土木工程、地质工程和地质灾害监测的探测地下的方法,通过利用电磁波在不同介质之间的不同反射特性来探测和识别地下物体,GPR 通常沿测线采集高分辨率 B-Scan 雷达图,然而 B-Scan 雷达图在检测到目标响应时会伴有因不均匀地表的强反射、地下土层界面的回波以及发射和接收天线之间直接耦合所产生的杂波,有的杂波甚至掩盖了目标相应,严重影响了目标检测算法的性能。随着深度学习以及大模型的...
Microsoft DeepSpeed-Inference等知名的深度学习库相比,ByteTransformer在可变长输入下最高实现131%的加速。论文代码已开源。论文地址:https://arxiv.org/abs/2210.03052 IPDPS: 并行和分布式计算方向计算机系统领域的旗舰会议。该会议专注于分享并讨论并行计算、分布式计算、大规模数据处理以及高性能计算等相关领域的最新研究进展。参与的专家学者来自世界各地的顶尖研究机构和企业,共同探讨该领域的创新发展和前沿技术。 代码...
# 📑前言> 对大模型的简单理解:有着大量数据进行的深度学习或机器学习的模型,这些数据可以通过训练过程自动调整以捕获输入数据中的复杂关系。这类模型通常具有较深的网络结构和较多的神经元,以增加模型的表示能力... 分布式训练(Distributed Training)和混合精度训练(Mixed Precision Training)以上是一些大模型所会采用的部分技术列举。通过这些高级技术和策略才共同支持了大模型的开发和应用,使其在各种复杂任务中取得了出...
随着机器学习的发展,模型及训练模型所需的数据量越来越大,也都趋向于通过分布式训练实现。而算法工程师通常需要对这些分布式框架涉及到的底层文件存储和调度系统有较深的理解,才能够快速批量开启模型训练,保证资源... 抖音搜索等业务的超大规模深度学习训练,日均可达上万任务的训练,450W Core资源的使用。# 未来规划1. 开源 Primus 更多能力后续将陆续开放,详见:https://mp.weixin.qq.com/s/uGBy-WpdjTMUy-7MQAZiww1. Primu...
字节的同学们就开始尝试更加系统性地将一些自身的技术突破拿出来形成一个完整的项目,回馈给开源社区,也就是主动开源阶段。到 2022 年,字节跳动已经开源了超过 50 个项目,随着主动开源项目的逐渐增多,我们发现大... 分布式深度学习通信框架 BytePS,云原生项目合集 KubeWharf 等。今年我们在 AI/ML 编译器、隐私计算等领域也会有非常有价值的项目开源出去,期待各位的参与和支持。最后引用一下字节跳动的使命“激发创造,丰富生活...