[picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/44b74ab4861f41bb8b8defb68ffb7e98~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1714839646&x-signature=DK4Xpl1TLAfyLVeoBayw6d9llcU%3D)**前言**在 2023 年疫情早已结束的当下,时代也在飞速的发展和进步,越来越多的技术:深度学习、AI、大模型、虚拟现实VR等慢慢进入我们的生活。**基于大模型的图像去雾**在今年这个阶段,我...
随着可穿戴设备的普及和发展,声场分析和 3D 音效为 VR 和 AR 打造了身临其境的声音效果,提升了沉浸式的音频体验。随着谷歌在音视频通讯中采用音视频结合的音频处理技术,极大程度的改善了音频质量,为传统的单独音频信号处理往多模态维度扩展提供了开拓性的思路。我们可以看到音频信号处理技术的发展,从传统的基于先验假设的数字信号处理技术逐渐向基于深度学习的多模态音频处理技术过渡。而在字节跳动的业务中,多模态音频处理...
深度学习也在其中起着重要作用。不知道小伙伴们熟不熟悉工业领域的缺陷检测腻?🧐🧐🧐今天就以钢轨表面缺陷为例,和大家唠唠基于深度学习的钢轨表面伤损细粒度图像识别与目标检测,***总结一下工业缺陷检测流程***,包... =&rk3s=8031ce6d&x-expires=1714839657&x-signature=nORCavRby8S9DM%2Brr70rYUUQJT8%3D)在数据集中还出现了许多对比度低,肉眼不容易标注的图像,比如背景非常黑暗,聚焦模糊或者轨面有反光。这些图像数据在工业领域...
**边缘ML:** 是指机器学习在不处于核心数据中心的,企业级计算机/设备中的应用。边缘设备包括服务器机房,现场服务器,以及位于各个地区以加快响应速度为目的的小型数据中心。云端和边缘端的ML 已经通过3年多的科普,广为大众所接受。今天我们看到的人脸门禁、摄像头行为识别、智能音箱...... 绝大部分场景都属于这两类。 以 TensorFlow & TF lite 等开源深度学习框架为基础的大量应用,推动了智能在云端和边缘端应用。然而,更加具有...
AI的爆火在于它确实能促进整个社会中大多人群的学习工作和生活的效率的提升,这是非常实用的。我要和大家分享的项目也是我学习AI过程中做的小项目,是利用视频分析技术结合深度学习构建的一个智能视频监控系统,用来进... 提供监测识别和报警等功能,还能用于大数据分析,远程访问和管理等等。下面我将使用软件工程的思路,为大家详细介绍我是如何使用深度学习与视频分析技术构建项目的。# 项目细节## 需求分析这可能是一个与本文主...
## 背景: 全景视频技术是 VR/AR 领域实现 3D 视频中的一项重要技术,而传统的[全景视频](https://www.infoq.cn/article/DECEU61vkxXv7s9h3pKS "xxx")仅具有三自由度( 3DOF ),即观察者的位置是固定的,只能体验... 透明纹理和高光纹理等情况。 #### 全景视图深度估计模型: 我们提出采用深度学习的方法来估算全景视图所对应的深度视图,深度网络采用经典的编码器-解码器模型,其中编码器可采用常用的 backbone 模型,如...
# 前言从去年chatGPT爆火,到国内千模大战,关乎大模型的热度已经沸反盈天。但大模型出现的价值、意义似乎与实际使用效果存在鲜明的对比,特别是日常工作中,最多让大模型帮助生成一些不痛不痒、凑字数的内容,难易触达工作的核心环节。所以趁着国庆假期,我试图用国产大模型来协助完成一篇文章,从“知识生产”这个大模型擅长的角度来验证大模型能否更深度提升个人工作效率。![picture.image](https://p6-volc-community-sign.byte...
其实本人觉得深度使用的话,很多知识其实AIGC大模型是回答不好了,而且很多都是错误的答案。)![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/992c414fa5bd42fca60d13db4faff456~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1714839667&x-signature=yJ1QSbIhTVHOVRpx7fgs4rmgisE%3D)ChatGPT是一种人工智能技术,它可以通过学习和训练,模拟人类的语言和行为,实现与人类的交互和智...
一方面用于场景和故事的搭建,另一方面玩家可以通过 AIGC 的平台工具来创建自己的虚拟人,可以用于游戏中的打金等活动。**代码生成**资料显示,2022 年 AIGC 发展速度惊人,迭代速度更是呈现指数级爆发,其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为 AIGC 发展的“加速度”。# “智能诗歌生成”的AIGC项目我曾参与了一个名为“智能诗歌生成”的AIGC项目。该项目的主要目标是利用人工智能技术生成具有...
实现高性能特征读取和高效特征调研、特征工程加速模型迭代。**相关产品**:https://www.volcengine.com/product/flink # 机器学习样本存储:背景与趋势在字节跳动,机器学习模型的应用范围非常广泛。为了支持... 而随着深度学习的发展,我们可以利用深度学习的特征提取能力,通过简单的数据处理步骤自动学习特征,甚至可以将过程简化为在待调研的原始特征中往一张样本表格里加列的操作后利用深度学习框架自动学习和提取信息。 ...
大模型突破了过去深度学习的框架,构建了一套从思维链到思维算法的推理技术和强大的自然语言理解能力,可以让智能体拥有更强大的学习和迁移能力,从而可以创建更具智能性、更实用的智能体,开创了人机交互的新范式。在大模型的风潮下,今年也产生了很多新兴的优秀智能体。例如游戏领域小助手英伟达 Voyager 智能体、协助人们完成日常任务的 AI 助理 HyperWrite,以及专注于提供个人情感陪伴的 Pi 助手等。大模型是如何影响智能体的...
**前言**探地雷达(GPR)是一种广泛应用于土木工程、地质工程和地质灾害监测的探测地下的方法,通过利用电磁波在不同介质之间的不同反射特性来探测和识别地下物体,GPR 通常沿测线采集高分辨率 B-Scan 雷达图,然而 B-Scan 雷达图在检测到目标响应时会伴有因不均匀地表的强反射、地下土层界面的回波以及发射和接收天线之间直接耦合所产生的杂波,有的杂波甚至掩盖了目标相应,严重影响了目标检测算法的性能。随着深度学习以及大模型的...
随着可穿戴设备的普及和发展,声场分析和 3D 音效为 VR 和 AR 打造了身临其境的声音效果,提升了沉浸式的音频体验。随着谷歌在音视频通讯中采用音视频结合的音频处理技术,极大程度的改善了音频质量,为传统的单独音频信号处理往多模态维度扩展提供了开拓性的思路。我们可以看到音频信号处理技术的发展,从传统的基于先验假设的数字信号处理技术逐渐向基于深度学习的多模态音频处理技术过渡。而在字节跳动的业务中,多模态音频处...