基于深度学习的双目视觉三维重建

双目视觉三维重建是指利用两个摄像机进行成像，通过图像处理，利用三角测量的原理推导出具体物体的三维坐标，实现对三维物体姿态、形状的重建。

目前，深度学习技术被广泛应用于双目视觉三维重建领域，主要包括基于神经网络模型的深度学习和基于CNN的匹配方法。

基于神经网络模型的深度学习

双目图像的深度学习方法可分为四个步骤。

第一步是特征提取。利用深度卷积神经网络，提取左右摄像机中的特征点，形成特征描述子。一般使用Siamese结构，通过两个一模一样的卷积、池化等操作，抽取两张图片的特征。

第二步是视差计算。通过计算两张图像的特征相似度，得到图像像素点的视差值，即左右摄像机拍摄同一物体的像素点上下位置差，进而推算出目标点在三维坐标系中的位置。

第三步是图像分割。将原始图像分成超像素或小块，减少计算量，提高运算效率。

第四步是后处理。主要是通过算法对图像进行平滑处理，消除噪声，提高重建精度。

基于CNN的匹配方法

具体步骤如下：

第一步，将左右图像分别通过卷积操作转化成特征图，每个卷积操作对应一个卷积核。

第二步，将两幅图像特征图做差，得到一张视差图。若在左图中找到一个像素点P，使得这个点在右图中对应位置上像素值最低，那么点P和对应位置的像素点的水平距离就是P的视差。

第三步，根据视差和左图中的像素位置计算出3D点

本文内容通过AI工具匹配关键字智能整合而成，仅供参考，火山引擎不对内容的真实、准确或完整作任何形式的承诺。如有任何问题或意见，您可以通过联系service@volcengine.com进行反馈，火山引擎收到您的反馈后将及时答复和处理。

展开更多

机器学习平台

面向机器学习应用开发者，提供 WebIDE 和自定义训练等丰富建模工具、多框架高性能模型推理服务的企业级机器学习平台

产品详情页管理控制台说明文档

社区干货

这就驱使**火山引擎多媒体实验室**团队采用**基于视觉的方式对文物进行三维重建**。然而传统基于视觉的重建方法无法处理弱纹理物体,而且对于形状比较复杂的物品也难以重建(例如狭长的简牍、扁平的甲骨)。为此,采用**符号距离场**(Signed Distance Fields,简称SDF)的技术方案来表示三维物体,结合**深度学习**的方法克服了以上重建难点。SDF 表示了空间中每个点到物体的有向距离,是一种隐式表示,二维SDF的示意图如下。![pictur...

「一周资讯精选」定期更新 [11.4-11.10] | 火山引擎开发者社区

[基于火山引擎云搜索服务的排序学习实战](https://developer.volcengine.com/articles/7281495169214447672)3. [和德爷一起 6DoF 互动探险,火山引擎空间重建和虚实融合技术](https://developer.volcengine.com/articles/7282956887577296907)4. [搞流式计算,大厂也没有什么神话](https://developer.volcengine.com/articles/7288530615480090663)5. [Katalyst Memory Advisor:用户态的 K8s 内存管理方案](https://mp.weixin....

CVPR 2024 满分论文 | 基于可变形3D高斯的高质量单目动态重建新方法

进行动态场景的三维重建。尽管基于NeRF的一些代表工作,如D-NeRF,Nerfies,K-planes等已经取得了令人满意的渲染质量,他们仍然距离真正的照片级真实渲染(photo-realistic rendering)存在一定的距离。我们认为,其根本原因在于**基于光线投射(ray casting)的NeRF管线通过逆向映射(backward-flow)将观测空间(observation space)映射到规范空间(canonical space)无法实现准确且干净的映射**。逆向映射并不利于可学习结构的收敛,使得目前...

「火山引擎」视频云产品月刊-2023年9月

**更灵活:** 深度优化调度引擎,提升灵活性无损效率- **更高效:** 支持多种框架间的数据高效互转- **更易用:** 支持多语言接口,低成本构建视频应用- **更普适:** 多种语言开发模块无缝串联,提升开发效... 依托火山引擎多媒体实验室最新的三维重建技术,复刻线下文物到 PICO 虚拟场景中,并应用自研光场视频技术,采集并惟妙惟肖的还原动态人物的光场信息,在 VR 场景中提供高自由度的观看和交互体验。【新闻】[让文物“活...

特惠活动

2核4G共享型云服务器

Intel CPU 性能可靠，不限流量，学习测试、小型网站、小程序开发推荐，性价比首选

￥86.00/年1908.00/年

立即购买

2核4G计算型c1ie云服务器

Intel CPU 性能独享，不限流量，密集计算、官网建站、数据分析等、企业级应用推荐

￥541.11/年2705.57/年

立即购买

域名注册服务

cn/top/com等热门域名，首年低至1元，邮箱建站必选

￥1.00/首年起32.00/首年起

立即购买

基于深度学习的双目视觉三维重建-优选内容

让文物“活”起来,火山引擎视频云三维重建技术揭秘

「一周资讯精选」定期更新 [11.4-11.10] | 火山引擎开发者社区

火山引擎宋慎义:RTC技术核心挑战及发展趋势

双目等新场景;多信源也包括KTV合唱、多画面等应用;最近比较流行的全景声,也伴随着多声道和高精度采样等技术。全景视频分块并行编码其中全景视频对RTC的挑战巨大。火山引擎的解决方法是把360度的全景分层,分为一个... 同时传输的拓扑也会不断进行动态的生成与重建;另外音视频的拓扑也会面临分离传输的情况。火山引擎RTC在多人互动架构上也进行了多轮的演进: 在人数比较少的情况下,可以使用网状SFU(大多数RTC架构采用的方式),相对简...

CVPR 2024 满分论文 | 基于可变形3D高斯的高质量单目动态重建新方法