# beginning2023年可谓是人工智能浪潮翻涌的一年,AI在各个领域遍地开花。以我最熟悉的工业为例,深度学习也在其中起着重要作用。不知道小伙伴们熟不熟悉工业领域的缺陷检测腻?🧐🧐🧐今天就以钢轨表面缺陷为例,和大... 下图是对轨面图像进行基于受限对比度自适应直方图均衡化的难例图像辅助增强方法的效果图。可以看到,经过图像处理之后,原来集中在极亮区和极暗区的像素峰值就被拉平了,较均匀的分布于全部的灰度空间,细节方面得到了...
越来越多的技术:深度学习、AI、大模型、虚拟现实VR等慢慢进入我们的生活。**基于大模型的图像去雾**在今年这个阶段,我的主要工作是研究基于深度学习的图像去雾工作。随着现代工业文明的发展进步,大气污染现象愈... 能够使模型能够自适应地为感兴趣的特征分配更多的权重。用浅显易懂的话来说就是对于图像去雾的效果更加理想了。 一些模型引入与通道注意模块串联或并行的空间注意模块,使网络集中在雾霾难以去除的区域,能够更加彻底...
随着深度学习以及大模型的普及,人们开始尝试将其应用到探地雷达图像去杂波任务中。 **基于深度学习的探地雷达图像去杂波**凭借强大的特征表示和学习能力,基于深度学习的方法已被广泛用于解决探地雷达杂波去... 使得模块可以自适应的调节残差块内卷积核大小,从而更好地拟合非线性变化以达到有效去除 GPR 图像中杂波的目的。同时弹性残差块的加入能够在在几乎不影响网络时间复杂度的情况下更有效的将有用的特征信息进行提取,避...
## 音频信号处理发展趋势从我这些年的工作过程中,我把音频信号处理分为了三个大的部分:- 最基础的部分是算法,包括自适应滤波器、阵列信号处理以及心理声学和深度学习等算法技术。- 算法基础可以保证上层关键技术组件的技术演进。比如自适应滤波器理论的发展大大加速了回声消除在各业务场景中的应用;阵列信号处理技术则确保了声源定位以及波束形成在消费电子以及音视频创作中的效果。深度学习和心理声学技术的发展也大大...
> 作者|周强近日,第五届深度学习图像压缩挑战赛(以下将简称“ CLIC 大赛”)比赛结果公布,首次参赛的火山引擎视频云多媒体实验室夺得视频压缩赛道第一名。压缩技术对于图像、视频应用十分重要。在保证同样的质量前提下,如何将图像压缩到更小的体积便于互联网信息传输,火山引擎视频云团队不断突破压缩技术“天花板”。当前字节跳动高峰期每秒需处理近百万张图片,基于今日头条、抖音等亿级 DAU 的实践打磨,与国际领先的压缩技术...
近日,第五届深度学习图像压缩挑战赛(以下将简称“ CLIC 大赛”)比赛结果公布,首次参赛的火山引擎视频云多媒体实验室夺得视频压缩赛道第一名。压缩技术对于图像、视频应用十分重要。在保证同样的质量前提下,如何将图像压缩到更小的体积便于互联网信息传输,火山引擎视频云团队不断突破压缩技术“天花板”。当前字节跳动高峰期每秒需处理近百万张图片,基于今日头条、抖音等亿级 DAU 的实践打磨,与国际领先的压缩技术,火山引擎视频云...
人工智能的核心在于学习和适应。AI系统通过算法来模拟人类的学习过程,从而解决问题和执行任务。基于深度学习的神经网络也是如此,经过大量的训练才能够更准确的预测我们所需要的结果。例如在一个健康监测系统的项目... 我们可以构建更加智能和自适应的应用程序。例如,在一个聊天机器人项目中,利用大模型的能力,我们可以构建一个能够提供准确、个性化建议的系统。## 技术融合的未来趋势在未来,我感觉大数据、AI和大模型将会更加紧...
**阵列信号处理** 以及 **心理声学** 和 **深度学习** 等算法技术。* 算法基础可以保证上层 **关键技术组件** 的技术演进。比如自适应滤波器理论的发展大大加速了回声消除在各业务场景中的应用;阵列信号处理技术则确保了声源定位以及波束形成在消费电子以及音视频创作中的效果。深度学习和心理声学技术的发展也大大加速了多模态音视频信号处理技术的发展,保证了声音效果。* 有了这些基础就可以为上层业务,比如 **声场还原...
再次接收了火山语音团队有关机器学习的技术研究成果,即“ **基于自适应迁移核函数的迁移高斯回归模型”( ADATPITVE TRANSFER KERNEL LEARNING FOR TRANSFER GAUSSIAN PROCESS REGRESSION)** https://ieeexplor... 旨在提高数据表征能力和域相关性的建模能力:具体来说理论证明了如何建模域相关性以确保提出的迁移核函数满足核函数( **kernel** )的基本要求(半正定性),并讨论了不同域相关性对应的迁移场景;更重要的还展示了改进...
都是老猿自己学习的总结。老猿是个对细节蛮纠结的人,很容易钻到各种学习的细节中去,优点就是有些深度的认识和收获,发布的博客文章有区别于别人的内容,缺点有两条,一是学习进展慢,二是有时耗时很久都钻不出某个问... 导致在计算机视觉学习过程中步履艰难。老猿这一年多的学习过程基本分为三个阶段:1. 老猿 2020 年 8 月开始学习 OpenCV,从基本的图像读写开始、到图像显示窗口的回调处理、阈值处理及自适应阈值处理、几何图像绘...
简称 -- 指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型设计的目的:大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理... 大模型的发展模式应该会和各行各业深度合作开展更专业的领域探索和发展的道路。1:场景化的认知智能体--大模型驱动相应智能体具备复杂环境的自适应感知和认知能力并具备一定的自治和自主性。2:通用大模型的跨领...
深度介绍ByteHouse性能提升的相关经验。 **在复杂查询上,ByteHouse解决了ClickHouse缺少优化器支持的问题,**从RBO(基于规则的优化能力)、CBO(基于代价的优化能力)、分布式计划生成方面推出了自研优化器,... 在较大规模集群上也自适应的支持 Shuffle-Aware 的 RuntimeFilter。 **在宽表查询上,ByteHouse主要通过全局字典、Zero copy以及UncompressedCache 来进行性能提升。**首先,全局字典主要通过编码方式将变长...
* 传统机器学习模型,如 LR 和 XBG 等;* 深度学习模型-向量内积模型,如双塔、三塔等;+ 线上计算速度快,对工程依赖少,实现复杂度低;+ 无法直接应用交叉特征,需要针对性设计。* 深度学习模型-交叉多层模型,如 CO... 长期行为序列和 Query 语义表征,关注于行为序列部分,作者针对不同序列设计不同结构,实时输入为商品序列,采用 LSTM+ 多头注意力结构实现,短期较实时少 LSTM,长期输入为 4 种属性序列做 Pooling。在关联 Query 时,作...