老猿想学习一下 Python,4 月入住国内某程序员汇聚的知名技术博客,开启了老猿学习 Python 并分享学习体会之路,先是 Python 基础,接着是 Python 爬虫,然后是 Python 图像界面开发的 PyQt,再接着是 Python 的音视频剪辑 Moviepy,前后花费了 1 年半左右的时间,这期间发布了近 1000 篇博客,当然有灌水的内容,也有精华的文章,都是老猿自己学习的总结。老猿是个对细节蛮纠结的人,很容易钻到各种学习的细节中去,优点就是有些深度的认识...
## 前言前置知识:Python基础知识,因为本文主要以Python的角度来介绍卷积运算### 对卷积的理解在学习卷积运算之前,我们先来了解什么是卷积运算?卷积运算 **(Convolution)** 是信号处理和图像处理领域中的重... 卷积运算是深度学习算法中最核心、最基础的概念,参与运算的通常为高维数组(如四维)。但是对于初学者来说,很难直接轻松理解高维数组的卷积运算,因此我们先从卷积运算的最简单的一维开始体验,再逐步增加维度,最终完全...
# 一、背景随着CV算法在业务场景中使用越来越多,给我们带来了新的挑战,需要提升Python推理服务的性能以降低生产环境成本。为此我们深入去研究Python GPU推理服务的工作原理,推理模型优化的方法。最终通过两项关键... TensorRT是由英伟达公司推出的一款用于高性能深度学习模型推理的软件开发工具包,可以把经过优化后的深度学习模型构建成推理引擎部署在实际的生产环境中。TensorRT提供基于硬件级别的推理引擎性能优化。下图为业界...
发行的跨平台计算机视觉和机器学习软件开源库,可以运行在 Linux、Windows、Android 和 Mac OS 操作系统上。 它轻量级而且高效——由一系列 C 函数和少量 C++ 类构成,实现了图像处理和计算机视觉方面的很多通用算法。OpenCV-Python 是 OpenCV 适配 Python 的一个图像处理和计算机视觉处理库。### 二、一些 Moviepy 无法支持可由 OpenCV 完成的视频处理场景我们知道视频是一帧帧图像和音频构成的,在进行视频处理时,当 Moviepy ...
概述embedding 用于将非结构化数据向量化,通过深度学习神经网络提取文本、图片、音视频等非结构化数据里的内容和语义,把文本、图片、音视频等变成特征向量。 说明 当前 Embedding 服务仅支持将文本生成向量。 当前... 示例 请求参数Python list = [RawData("text","hello1"), RawData("text","hello2")]res = vikingdb_service.embedding(EmbModel("bge-large-zh"), list) 返回值Python 调用执行上面的任务,返回 list 、list > ...
概述embedding 用于将非结构化数据向量化,通过深度学习神经网络提取文本、图片、音视频等非结构化数据里的内容和语义,把文本、图片、音视频等变成特征向量。 说明 当前 Embedding 服务仅支持将文本生成向量。 当前... 示例 请求参数Python list = [RawData("text","hello1"), RawData("text","hello2")]res = vikingdb_service.embedding(EmbModel("bge-large-zh"), list) 返回值Python 调用执行上面的任务,返回 list 、list > ...
[picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/44b74ab4861f41bb8b8defb68ffb7e98~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1713975622&x-signature=u9YuDKtVVrdiCuLIu66bkq8Ni2k%3D)**前言**在 2023 年疫情早已结束的当下,时代也在飞速的发展和进步,越来越多的技术:深度学习、AI、大模型、虚拟现实VR等慢慢进入我们的生活。**基于大模型的图像去雾**在今年这个阶段,我...
**边缘ML:** 是指机器学习在不处于核心数据中心的,企业级计算机/设备中的应用。边缘设备包括服务器机房,现场服务器,以及位于各个地区以加快响应速度为目的的小型数据中心。云端和边缘端的ML 已经通过3年多的科普,广为大众所接受。今天我们看到的人脸门禁、摄像头行为识别、智能音箱...... 绝大部分场景都属于这两类。 以 TensorFlow & TF lite 等开源深度学习框架为基础的大量应用,推动了智能在云端和边缘端应用。然而,更加具有...
概述embedding 用于将非结构化数据向量化,通过深度学习神经网络提取文本、图片、音视频等非结构化数据里的内容和语义,把文本、图片、音视频等变成特征向量。 说明 当前 Embedding 服务仅支持将文本生成向量。 当前 Embedding 服务接口不支持承载高并发请求,请求数量过多时请求会被丢弃。 请求参数参数 子参数 类型 是否必选 说明 EmbModel 说明 EmbModel 实例。 modelName string 是 指定模型名称,当前支持的模型有 ...
概述embedding 用于将非结构化数据向量化,通过深度学习神经网络提取文本、图片、音视频等非结构化数据里的内容和语义,把文本、图片、音视频等变成特征向量。 说明 当前 Embedding 服务仅支持将文本生成向量。 当前 Embedding 服务接口不支持承载高并发请求,请求数量过多时请求会被丢弃。 请求参数参数 子参数 类型 是否必选 说明 EmbModel 说明 EmbModel 实例。 modelName string 是 指定模型名称,当前支持的模型有 ...
随着深度学习以及大模型的普及,人们开始尝试将其应用到探地雷达图像去杂波任务中。 **基于深度学习的探地雷达图像去杂波**凭借强大的特征表示和学习能力,基于深度学习的方法已被广泛用于解决探地雷达杂波去... 我们主要采用两种方法来提升模型速度:减小图片大小和降低模型复杂度。减小图片大小可以最直接地减少运算量,但是图像会丢失掉大量的细节从而影响精度。降低模型复杂度则会导致模型的特征提取能力减弱,从而影响分割精...
基于深度学习算法,对包含人像人体内容的图像进行智能编辑与处理,包括人像编辑、人像技术、人体与行为分析等功能,可满足用户对于人像人体编辑的多元化需求
接口简介基于深度学习,对图像质量进行多项修复和优化,包括去雾、去噪、黑白上色、超分辨率无损放大等,且产品能智能去除图片噪点、模糊,并增强色彩及细节效果。 限制条件名称 内容 图片要求 1. 图片格式:JPG、JPEG、PNG、BMP等常见格式,建议使用JPG格式。2. 图片文件大小:最大 5 MB。3. 图片分辨率最大3072 x 3072像素。 请求说明名称 内容 接口地址 https://visual.volcengineapi.com 请求方式 POST Content-Type application/...