我的主要工作是研究基于深度学习的图像去雾工作。随着现代工业文明的发展进步,大气污染现象愈发严重,由此产生的雾霾天气困扰着人们的出行和工作。雾霾是导致图像模糊的最主要原因之一,受雾霾天气影响,专业的监控和遥感成像系统所拍摄的图像也无法满足相应的工作需求,并且也会有一些烟、尘、雾等漂浮颗粒影响室内图像。数字图像质量的恶化会影响各种视觉任务的执行与处理。因此需要对图像进行预处理,以降低雾霾对其成像质量的影响...
随着机器学习和深度学习的发展,AI技术也在不断地推陈出新,也融入到了在我的工作和生活中,今年以来我的主要研究方向便是人工智能的方向。 # AI技术 近年来,基于AI的预训练技术在文档理解任务方面取得了显着... 在深度学习方面取得了快速进展。 最近提出的基于AI的LayoutLMv3模型非常成功,LayoutLMv3 是文档 AI 中第一个多模态模型,不依赖于预训练的卷积神经网络来提取视觉特征,这样节省了参数并消除了区域注释。LayoutL...
作为深度学习算法的训练标签。之后就是预处理工作,这里设计的比较复杂,包括去噪,归一化,裁剪等等操作,也是比较耗时的部分,结束后材料用于深度模型的训练。这里也应用到了计算机视觉的一些知识,令人印象深刻的就是系统可以自动提取影像特征。这里我简单演示如何进行MRI影像数据的标注和预处理。```import numpy as npimport cv2#标注def annotate_image(image, annotations): annotated_image = image.copy() for ...
# 引言AI爆火的2023年,也是我开始学习AI的第一年,从后端领域向AI领域发展也是一个不错的选择。是什么原因让我觉得AI领域更值得钻研和发展呢?其实之前的文章也能体现出来,AI的爆火在于它确实能促进整个社会中大多人群的学习工作和生活的效率的提升,这是非常实用的。我要和大家分享的项目也是我学习AI过程中做的小项目,是利用视频分析技术结合深度学习构建的一个智能视频监控系统,用来进行实时监测和分析人员活动,提供监测识别和...
在指定图像内容库中,通过图像文件快速检索视觉上相同或相似的图像信息,应用于视觉素材搜索、图像内容比对、拍照搜同款商品等场景。 核心优势 搜索效果出众基于大规模深度学习的视觉搜索算法,搜索精准度和召回率表现出众。 支持海量图库支持亿级海量图像数据建库索引,同时保障以图搜图毫秒级响应速度。 服务稳定可靠经过实际业务验证的大规模搜索流量承载能力,稳定支持高并发场景。 搜索算法定制根据客户业务场景需求,灵活定制视觉...
作为深度学习算法的训练标签。之后就是预处理工作,这里设计的比较复杂,包括去噪,归一化,裁剪等等操作,也是比较耗时的部分,结束后材料用于深度模型的训练。这里也应用到了计算机视觉的一些知识,令人印象深刻的就是系统可以自动提取影像特征。这里我简单演示如何进行MRI影像数据的标注和预处理。```import numpy as npimport cv2#标注def annotate_image(image, annotations): annotated_image = image.copy() for ...
# 引言AI爆火的2023年,也是我开始学习AI的第一年,从后端领域向AI领域发展也是一个不错的选择。是什么原因让我觉得AI领域更值得钻研和发展呢?其实之前的文章也能体现出来,AI的爆火在于它确实能促进整个社会中大多人群的学习工作和生活的效率的提升,这是非常实用的。我要和大家分享的项目也是我学习AI过程中做的小项目,是利用视频分析技术结合深度学习构建的一个智能视频监控系统,用来进行实时监测和分析人员活动,提供监测识别和...
# beginning2023年可谓是人工智能浪潮翻涌的一年,AI在各个领域遍地开花。以我最熟悉的工业为例,深度学习也在其中起着重要作用。不知道小伙伴们熟不熟悉工业领域的缺陷检测腻?🧐🧐🧐今天就以钢轨表面缺陷为例,和大... 就可以提出视觉测量的分析方法了,比如测量轨面的光带宽度、伤损的尺寸、轻重伤的总数这样的量化评价指标。有了视觉测量的信息之后,就可以分别定义各个尺度的数据分析、数据结构了,比如实例尺度的微观伤损形位的数据...
# 📑前言> 对大模型的简单理解:有着大量数据进行的深度学习或机器学习的模型,这些数据可以通过训练过程自动调整以捕获输入数据中的复杂关系。这类模型通常具有较深的网络结构和较多的神经元,以增加模型的表示能力和学习能力。大模型的诞生影响,对如今发展的许多领域,诸如自然语言处理、计算机视觉和语音识别等等,都有着显著的成果!![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/179ca2b...
系统会自动抓取数据,根据我们描述的指令进行创作。**图像创作**技术平台降低了艺术绘画创作的门槛,用户只需要通过输入文字描述,计算机将会自动生成一张作品。**视频创作**例如 Google 推出了 AI 视频生成模型... 其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为 AIGC 发展的“加速度”。# “智能诗歌生成”的AIGC项目我曾参与了一个名为“智能诗歌生成”的AIGC项目。该项目的主要目标是利用人工智...
基于深度学习的视频质量评分和视频画面质量检测,支持噪声、亮度、色彩、综合等不同维度的评分,同时支持对视频质量问题,如黑帧、水波纹等进行修复。 前提条件您已登录智能处理控制台。 操作步骤您可以管理已创建的模... 由机器去模仿人类对于视频的视觉感受。支持选择整体评分和单项评分。 整体评分:支持 VQScore、伪高清识别的选择。 VQScore:Video Quality Score。是一个自研的基于深度学习的无参考视频质量评价指标,用于表示观看当...
# 前言从去年chatGPT爆火,到国内千模大战,关乎大模型的热度已经沸反盈天。但大模型出现的价值、意义似乎与实际使用效果存在鲜明的对比,特别是日常工作中,最多让大模型帮助生成一些不痛不痒、凑字数的内容,难易触达工作的核心环节。所以趁着国庆假期,我试图用国产大模型来协助完成一篇文章,从“知识生产”这个大模型擅长的角度来验证大模型能否更深度提升个人工作效率。![picture.image](https://p6-volc-community-sign.byte...
**前言**探地雷达(GPR)是一种广泛应用于土木工程、地质工程和地质灾害监测的探测地下的方法,通过利用电磁波在不同介质之间的不同反射特性来探测和识别地下物体,GPR 通常沿测线采集高分辨率 B-Scan 雷达图,然而 B-Scan 雷达图在检测到目标响应时会伴有因不均匀地表的强反射、地下土层界面的回波以及发射和接收天线之间直接耦合所产生的杂波,有的杂波甚至掩盖了目标相应,严重影响了目标检测算法的性能。随着深度学习以及大模型的...