我的主要工作是研究基于深度学习的图像去雾工作。随着现代工业文明的发展进步,大气污染现象愈发严重,由此产生的雾霾天气困扰着人们的出行和工作。雾霾是导致图像模糊的最主要原因之一,受雾霾天气影响,专业的监控和遥感成像系统所拍摄的图像也无法满足相应的工作需求,并且也会有一些烟、尘、雾等漂浮颗粒影响室内图像。数字图像质量的恶化会影响各种视觉任务的执行与处理。因此需要对图像进行预处理,以降低雾霾对其成像质量的影响...
# 1.前言从1956年AI概念的提出至今,人工智能技术已发展了60多年,22年12月底ChatGPT的横空出世使得生成式AI的全球爆火,ChatGPT的火爆出圈,也相继出现了文心一言、Midjourney等创新性的 AI 产品,互联网掀起的 AI 风暴可以说已经席卷了全球。一系列AI产品的出现当然引起了诸多的关注,年初我也作为一名AI小白进入了AI领域,通过时长近一年的学习和实践,总算对深度学习和计算机视觉方面有一定的了解了,这更加坚定了我继续努力探索A...
在深度学习方面取得了快速进展。 最近提出的基于AI的LayoutLMv3模型非常成功,LayoutLMv3 是文档 AI 中第一个多模态模型,不依赖于预训练的卷积神经网络来提取视觉特征,这样节省了参数并消除了区域注释。LayoutLMv3模型通过统一的离散标记重建目标 减轻了文本和图像多模态表示学习之间的差异。我们进一步提出了单词补丁对齐目标,以促进跨模式对齐学习。LayoutLMv3 是一个通用模型,适用于以文本为中心和以图像为中心的文档AI任务...
# beginning2023年可谓是人工智能浪潮翻涌的一年,AI在各个领域遍地开花。以我最熟悉的工业为例,深度学习也在其中起着重要作用。不知道小伙伴们熟不熟悉工业领域的缺陷检测腻?🧐🧐🧐今天就以钢轨表面缺陷为例,和大... 就可以提出视觉测量的分析方法了,比如测量轨面的光带宽度、伤损的尺寸、轻重伤的总数这样的量化评价指标。有了视觉测量的信息之后,就可以分别定义各个尺度的数据分析、数据结构了,比如实例尺度的微观伤损形位的数据...
# 1.前言从1956年AI概念的提出至今,人工智能技术已发展了60多年,22年12月底ChatGPT的横空出世使得生成式AI的全球爆火,ChatGPT的火爆出圈,也相继出现了文心一言、Midjourney等创新性的 AI 产品,互联网掀起的 AI 风暴可以说已经席卷了全球。一系列AI产品的出现当然引起了诸多的关注,年初我也作为一名AI小白进入了AI领域,通过时长近一年的学习和实践,总算对深度学习和计算机视觉方面有一定的了解了,这更加坚定了我继续努力探索A...
由机器去模仿人类对于视频的视觉感受。支持选择整体评分和单项评分。 整体评分:支持 VQScore、伪高清识别的选择。 VQScore:Video Quality Score。是一个自研的基于深度学习的无参考视频质量评价指标,用于表示观看当前视频的用户视觉感受,反映视频的视觉质量。值越高表示视频质量越好。 伪高清识别:仅支持 1080P 及以上视频进行检测,否则返回 -1 值。值越高表示视频质量越好,符合高清视频清晰度,值越低表示视频越可能是伪高清视频...
在深度学习方面取得了快速进展。 最近提出的基于AI的LayoutLMv3模型非常成功,LayoutLMv3 是文档 AI 中第一个多模态模型,不依赖于预训练的卷积神经网络来提取视觉特征,这样节省了参数并消除了区域注释。LayoutLMv3模型通过统一的离散标记重建目标 减轻了文本和图像多模态表示学习之间的差异。我们进一步提出了单词补丁对齐目标,以促进跨模式对齐学习。LayoutLMv3 是一个通用模型,适用于以文本为中心和以图像为中心的文档AI任务...
# beginning2023年可谓是人工智能浪潮翻涌的一年,AI在各个领域遍地开花。以我最熟悉的工业为例,深度学习也在其中起着重要作用。不知道小伙伴们熟不熟悉工业领域的缺陷检测腻?🧐🧐🧐今天就以钢轨表面缺陷为例,和大... 就可以提出视觉测量的分析方法了,比如测量轨面的光带宽度、伤损的尺寸、轻重伤的总数这样的量化评价指标。有了视觉测量的信息之后,就可以分别定义各个尺度的数据分析、数据结构了,比如实例尺度的微观伤损形位的数据...
# 📑前言> 对大模型的简单理解:有着大量数据进行的深度学习或机器学习的模型,这些数据可以通过训练过程自动调整以捕获输入数据中的复杂关系。这类模型通常具有较深的网络结构和较多的神经元,以增加模型的表示能力和学习能力。大模型的诞生影响,对如今发展的许多领域,诸如自然语言处理、计算机视觉和语音识别等等,都有着显著的成果!![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/179ca2b...
深度学习方法能以更方便的方式对特征进行提取,在图像分类、人工智能等领域取得了良好的效果。近些年来,一些研究人员开始将深度学习方法应用于癫痫发作检测领域。# 方法## 1融合GCN和transformer的癫痫自动检测... 后又在计算机视觉、多模态等领域都取得了不错的成绩,并逐渐扩展到其他领域。目前针对于脑电信号特征提取方面的研究还比较匮乏。基本模型为:![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn...
**前言**探地雷达(GPR)是一种广泛应用于土木工程、地质工程和地质灾害监测的探测地下的方法,通过利用电磁波在不同介质之间的不同反射特性来探测和识别地下物体,GPR 通常沿测线采集高分辨率 B-Scan 雷达图,然而 B-Scan 雷达图在检测到目标响应时会伴有因不均匀地表的强反射、地下土层界面的回波以及发射和接收天线之间直接耦合所产生的杂波,有的杂波甚至掩盖了目标相应,严重影响了目标检测算法的性能。随着深度学习以及大模型的...
计算机视觉等前端开发领域。它能帮助开发者更好地理解用户需求,并提供个性化的体验。但是,随着时间的推进,我们开始注意到AI也开始渗透进入后端开发这个区域。随着微服务和无服务器计算等技术的发展,后端体系结构变得越来越分布和动态,这也给运维带来更多挑战。一方面需要高效调度资源,另一方面也面临着更多的性能问题定位。AI系统通过分析庞大的监控数据,可能可以提前发现问题并自动修复。随着人工智能核心技术如深度学习的成熟...
深度学习的模型主要以下采样/局部块采样的形式分析视频内容,而忽视了实际空域分辨率和时域帧率对视频质量的影响,随着高分辨率和高帧率视频投稿逐渐普及,特别是跨分辨率/帧率视频转码档位画质评估场景中,这种影响变得更加不可忽视。在本文中,**我们提出了一种模块化 BVQA 模型,以及一种** **训练该模型以提高其模块化性的方法**。我们的模型包括基础质量预测模块、空域矫正模块和时域矫正模块,分别显式地响应视频质量的视觉内容和...