随着深度学习技术的不断发展,在图像识别领域的性能有了显著提高。不仅仅可以用来识别静态图像中的物体,还可以对视频中的物体进行实时的检测和跟踪,这里使用的是pytorch来进行模型的搭建以及物体的检测和跟踪。首... 它通过分类来检出图片中所有的目标,之后运用回归网络来精确匹配出每个物体边框。而实时跟踪模型,最常用的是Siamese-CNN,它从帧到帧之间链接分割,以追踪每个被观察到的行人,使跟踪的结果更加精准。要使用pytorch来...
# beginning2023年可谓是人工智能浪潮翻涌的一年,AI在各个领域遍地开花。以我最熟悉的工业为例,深度学习也在其中起着重要作用。不知道小伙伴们熟不熟悉工业领域的缺陷检测腻?🧐🧐🧐今天就以钢轨表面缺陷为例,和大家唠唠基于深度学习的钢轨表面伤损细粒度图像识别与目标检测,***总结一下工业缺陷检测流程***,包括从最开始的数据标注,中间的算法原理,再到最后的落地应用。无论你是搞实际项目or发论文or开阔视野,相信都会有所收获...
通过利用电磁波在不同介质之间的不同反射特性来探测和识别地下物体,GPR 通常沿测线采集高分辨率 B-Scan 雷达图,然而 B-Scan 雷达图在检测到目标响应时会伴有因不均匀地表的强反射、地下土层界面的回波以及发射和接收天线之间直接耦合所产生的杂波,有的杂波甚至掩盖了目标相应,严重影响了目标检测算法的性能。随着深度学习以及大模型的普及,人们开始尝试将其应用到探地雷达图像去杂波任务中。 **基于深度学习的探地雷达图像...
我要和大家分享的项目也是我学习AI过程中做的小项目,是利用视频分析技术结合深度学习构建的一个智能视频监控系统,用来进行实时监测和分析人员活动,提供监测识别和报警等功能,还能用于大数据分析,远程访问和管理等等... 这里我选用的是图像处理库(如OpenCV)对视频流进行预处理,这些技术也已经非常成熟。视频还需要进行解码与帧的提取,这是为了方便后续的人脸检测和行为识别,使用了oneAPI加速工具对视频进行解码。人脸检测模块使用了O...
产品简介基于深度学习,对图像质量进行评分,包括清晰度、美学、亮度、人脸、对比度、黑边、三明治、白天夜晚等多个维度。 产品优势算法出色:基于海量数据训练,评分准确。 能力丰富:从多个维度对图片进行打分,满足各... 应用场景相册管理 对图片多维度批量打分,智能管理相册。 画质监控 监控视频传输链路(如转码、增强等)的画质变化情况。 画风审核 在电商、视频、图文等消费场景辅助识别低质数据。 端上前置检测 在端上实拍场景识...
基于深度学习框架,结合检测识别技术,实现高精视觉分割能力。实现对多类主体、复杂背景等场景的抠图能力,同时支持人、货、场等多种类型需求,可广泛应用于电子商务、零售、泛文娱、个人应用等各种场景
随着时代的发展和技术人员不断地研究,深度学习技术逐渐在研究领域扩散开来,大数据也逐渐进入我们的生活,大模型也无处不在地帮助我们生活和工作。 # 大数据、大模型的应用总结 大数据技术在医疗领域的应用:可以帮助指导医疗团队进行更精确的诊断和治疗。基于大数据的建模和预测,可以减少医疗错误,提高治疗效果,从而提高医疗质量和患者满意度。 大数据技术在城市管理领域的应用:可以实时监控预测整个城市的交通状况,基...
用于检测并识别图片或视频中有抽烟行为的个体。 人脸检测-01-FaceNet-TRT TensorRT 物体检测 一种基于 NVIDIA FaceNet 模型的人脸检测模型,用于在图像或视频中准确地检测和定位人脸的位置,实现实时的人脸检测和跟踪。 人脸检测-02-BlazeFace-ONNX ONNX 物体检测 一种使用 PaddlePaddle 深度学习框架和 Blazeface 算法进行训练的人脸检测模型,用于在图像或视频中快速、准确地检测和定位人脸的位置。 YOLOX-Tiny-Python-后...
在学习AI的过程中,我深入了解了机器学习、深度学习、自然语言处理等关键技术,并对其在各个领域的应用有了更深刻的认识。## 🐬1.1 AIGC大模型学习体验有感说到总结,我觉得第一条就应该说一下现在爆火的Chatgpt了,我也是AIGC的深度依赖者。(当然写文不会用哈,只会辅助参考看一下相关知识,其实本人觉得深度使用的话,很多知识其实AIGC大模型是回答不好了,而且很多都是错误的答案。)![picture.image](https://p3-volc-communit...
例如AI深度学习、图像/视频渲染、科学计算等场景。 AI深度学习模型训练场景V100、A100、A30等类型的GPU显卡适用于AI模型训练场景,提供了大显存和高速访问能力,并叠加NVLink多卡互连,为多卡并行提供了超强计算能力。 应用推理场景T4、A10等类型的GPU显卡为AI推理提供了高效能比的加速能力,广泛应用于图像识别、语言翻译场景。 图像/视频渲染异构GPU渲染型实例提供高性能的3D图形虚拟化能力,可快速实现图片实时渲染,广泛应用于工程...
覆盖数十种行业和图像内容类别,支持数千种实体识别与多层级标签体系精准度高。 精准度高基于海量数据和深度学习技术,在业务场景中不断优化,算法精准度持续提升。 拓展性强拓展性强具备迁移学习能力的智能算法架构,可快速拓展扩展标签体系,丰富识别能力。 灵活定制丰富识别能力灵活定制可针对实际业务需要,快速定制开发图像识别能力,满足非通用场景的需求。 应用场景智能相册分类通过识别图像内容,实现相册类App的智能分类管理,支...
深度神经网络设计优化策略,如何结合 Transformer 大模型的特性做针对性的优化有待进一步研究。![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/6d1fd6a54f3b4a5eb6aa88a652eb6ffc~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1714666859&x-signature=DxNfsRrqwrFGrWxxqvc4wmBQVag%3D)# 项目分享下面我给大家分享一个基于预训练模型的命名实体识别(NER)应用:1.安装所需库...
影像识别一般就包括一些医学影像,比如X射线,MRI等等影像数据,这些数据很好获得,我们小组是去学校附近的医院进行沟通,获得了一些废弃的影像数据等,或者从网络拉去也可,方式多样。收集数据后进行数据的标注,比如疾病部位或是异常情况,作为深度学习算法的训练标签。之后就是预处理工作,这里设计的比较复杂,包括去噪,归一化,裁剪等等操作,也是比较耗时的部分,结束后材料用于深度模型的训练。这里也应用到了计算机视觉的一些知识,令...