# beginning2023年可谓是人工智能浪潮翻涌的一年,AI在各个领域遍地开花。以我最熟悉的工业为例,深度学习也在其中起着重要作用。不知道小伙伴们熟不熟悉工业领域的缺陷检测腻?🧐🧐🧐今天就以钢轨表面缺陷为例,和大... 我在这里使用的是yolov5进行迁移学习,得到一个基准模型。对这个基准模型的各类目标进行详细的性能评估,算法对轨面光带、剥离掉块、疲劳裂纹等这些伤损的各类难例都能进行较好的兼容。有了目标检测算法之后,就可以提...
**前言**探地雷达(GPR)是一种广泛应用于土木工程、地质工程和地质灾害监测的探测地下的方法,通过利用电磁波在不同介质之间的不同反射特性来探测和识别地下物体,GPR 通常沿测线采集高分辨率 B-Scan 雷达图,然而 B-Scan 雷达图在检测到目标响应时会伴有因不均匀地表的强反射、地下土层界面的回波以及发射和接收天线之间直接耦合所产生的杂波,有的杂波甚至掩盖了目标相应,严重影响了目标检测算法的性能。随着深度学习以及大模型的...
为大家详细介绍我是如何使用深度学习与视频分析技术构建项目的。# 项目细节## 需求分析这可能是一个与本文主题关联不大的模块,为了能让读者清楚了解项目背景,就简单总结几点项目需求。首先在功能方面,系统大致需要能解码视频并提取关键帧用于人脸检测和行为识别,并且要能展示分析结果,包括标注人脸和行为,还能够实时报警。系统性能方面,要在实时场景下对大量视频数据进行处理和分析,所以需要有高效的算法和硬件支持,简而言...
近日,第五届深度学习图像压缩挑战赛(以下将简称“ CLIC 大赛”)比赛结果公布,首次参赛的火山引擎视频云多媒体实验室夺得视频压缩赛道第一名。压缩技术对于图像、视频应用十分重要。在保证同样的质量前提下,如何将图... 监测图片的访问性能、错误率等指标使用。**网络分发**:在图片下载过程中,一般来说会首先访问 CDN 。若 CDN 未缓存,则会触发回源,请求由源站接入层转发到图片静图服务。该服务主要负责访问权限的校验、流量控制、...
**前言** 日前,第五届深度学习图像压缩挑战赛(以下将简称“ CLIC 大赛”)比赛结果公布,首次参赛的火山引擎视频云多媒体实验室夺得视频压缩赛道第一名。压缩技术对于图像、视频应用十分重要。在保证同样主观质... 为不降低应用性能,需要考虑耗时+带宽+画质等多个因子:对性能的影响主要是用户加载耗时(图片加载排队耗时、图片网络耗时、图片解码耗时),对成本影响主要是用户传输流量或者CDN分发带宽,对画质影响主要是画质清晰度和...
# 前言从去年chatGPT爆火,到国内千模大战,关乎大模型的热度已经沸反盈天。但大模型出现的价值、意义似乎与实际使用效果存在鲜明的对比,特别是日常工作中,最多让大模型帮助生成一些不痛不痒、凑字数的内容,难易触达工作的核心环节。所以趁着国庆假期,我试图用国产大模型来协助完成一篇文章,从“知识生产”这个大模型擅长的角度来验证大模型能否更深度提升个人工作效率。![picture.image](https://p6-volc-community-sign.byte...
infoq原文链接:[边缘智变:深度学习引领下的新一代计算范式 (infoq.cn)](https://xie.infoq.cn/article/39f62d756a0249615ba07102e)
其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为 AIGC 发展的“加速度”。# “智能诗歌生成”的AIGC项目我曾参与了一个名为“智能诗歌生成”的AIGC项目。该项目的主要目标是利用人工智能技术生成具有特定主题和风格的诗歌。以下是我在该项目中的实践经验和内容分享:**数据收集与预处理:** 首先,我们收集了大量的古代诗歌和现代诗歌数据,并对这些数据进行清洗和预处理,包括去除标点符号、停用词、分...
> 深度学习的模型规模越来越庞大,其训练数据量级也成倍增长,这对海量训练数据的存储方案也提出了更高的要求:怎样更高性能地读取训练样本、不使数据读取成为模型训练的瓶颈,怎样更高效地支持特征工程、更便捷地增删和回填特征。本文将介绍字节跳动如何通过 Iceberg 数据湖支持 EB 级机器学习样本存储,实现高性能特征读取和高效特征调研、特征工程加速模型迭代。**相关产品**:https://www.volcengine.com/product/flink # 机...
**边缘ML:** 是指机器学习在不处于核心数据中心的,企业级计算机/设备中的应用。边缘设备包括服务器机房,现场服务器,以及位于各个地区以加快响应速度为目的的小型数据中心。云端和边缘端的ML 已经通过3年多的科普,广为大众所接受。今天我们看到的人脸门禁、摄像头行为识别、智能音箱...... 绝大部分场景都属于这两类。 以 TensorFlow & TF lite 等开源深度学习框架为基础的大量应用,推动了智能在云端和边缘端应用。然而,更加具有...
[picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/44b74ab4861f41bb8b8defb68ffb7e98~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1714839646&x-signature=DK4Xpl1TLAfyLVeoBayw6d9llcU%3D)**前言**在 2023 年疫情早已结束的当下,时代也在飞速的发展和进步,越来越多的技术:深度学习、AI、大模型、虚拟现实VR等慢慢进入我们的生活。**基于大模型的图像去雾**在今年这个阶段,我...
本文介绍如何在Linux实例上基于NGC部署TensorFlow。 NGC介绍NGC(NVIDIA GPU CLOUD)是NVIDIA开发的一套深度学习容器库,具有强大的性能和良好的灵活性,可以帮助科学家和研究人员快速构建、训练和部署神经网络模型。NGC官网提供了当前主流深度学习框架的镜像,例如Caffe、TensorFlow、Theano、Torch等。 软件版本操作系统:本文以Ubuntu 18.04为例。 NVIDIA驱动:GPU驱动:用来驱动NVIDIA GPU卡的程序。本文以470.57.02为例。 CUDA:使GP...
随着机器学习和深度学习的发展,AI技术也在不断地推陈出新,也融入到了在我的工作和生活中,今年以来我的主要研究方向便是人工智能的方向。 # AI技术 近年来,基于AI的预训练技术在文档理解任务方面取得了显着... LayoutLMv3 在文档AI中以文本为中心的任务和以图像为中心的任务中实现了最先进的性能,达到了非常好的效果。 # 基于AI的多模态自监督预训练技术 由于在文档布局和图像表示学习方面的成功应用,在文档智能领域...