计算机视觉与语音技术

语音技术

生成基于语音识别的智能字幕服务，可以自动将视频中的语音和歌词快速转换成字幕

社区干货

大模型助力科技革命:2023年的里程碑与大模型的未来展望 | 社区征文

计算机视觉和语音识别等等,都有着显著的成果!![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/179ca2b2f7ed4720b5485a4dbb3c3e69~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1716049273&x-signature=PG8%2Fv%2FnNgkVh%2FoTx9zREmspw0aw%3D)# 一. 大模型所采用的高级技术0. 深度神经网络(Deep Neural Networks,DNNs)0. 卷积神经网络(Convolutional Neural Networks,CNNs...

一个老程序员的计算机视觉蹒跚学习之路| 社区征文

### 一、前言老猿是个 C++的老程序员,到底有多老呢,估计现在各平台发技术文章的博主中,很难有年龄比老猿大的。程序员这个活,是年轻人干的,并不怎么适合象我这种年纪的人,工作中也很少需要自己动手开发的。2019... 他开办的公司主要负责计算机视觉应用类软件的开发,例如用于石油行业钻井平台的监控,识别违规操作,提醒作业人员遵章守纪,主要使用 OpenCV 和人工智能 YOLO3 进行开发。但是遇到了一些难以解决的问题,一是基于 AI 的...

关于开展人工智能专业人员“计算机视觉处理设计开发工程师”专项培训的通知!

**2024年企业和个人都在报考的,由工信部颁发的AI人工智能证书!********《计算机视觉处理设计开发工程师》** **2024年** **1月24日至28日** **-** **北京******为进一步贯彻落实中共中央印发《关于深化人才发... 技术升级转型。以下为具体通知安排:![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/9a9027461ee349d59e19ba2437a27aa8~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-ex...

计算机视觉算法探究:OpenCV CLAHE 算法详解| 社区征文

### 一、引言2021 年 10 月开始学习 OpenCV 对比度受限的自适应直方图均衡 CLAHE,应用编程简单,了解详细算法却相当难。创建 CLAHE 对象时,只传递了两个参数:clipLimit 和 tileGridSize,其中 clipLimit 是裁剪限制参数,tileGridSize 图像的分块个数。关于参数含义及相关的介绍请参考《[OpenCV-Python自适应直方图均衡类CLAHE及方法详解](https://blog.csdn.net/LaoYuanPython/article/details/120850922)》。**CLAHE 算法的...

特惠活动

短文本语音合成 10千次

多音色、多语言、多情感，享20款免费精品音色

￥15.00/年30.00/年

立即购买

流式语音识别 30小时

音频流实时识别成文字，边说话边出文字

￥35.00/年54.00/年

立即购买

录音文件识别 30小时

5小时内音频文件转写成文本，适用非实时语音识别场景

￥11.40/年19.00/年

立即购买

计算机视觉与语音技术-优选内容

中国人工智能厂商全景报告|爱分析

报告下载中国人工智能厂商全景报告行业报告简介人工智能,是指运用机器学习、自然语言处理、计算机视觉、语音识别、语音合成、知识图谱等技术,并结合一定的业务场景形成解决方案,以辅助、增强或代替人工来制定决策或执行任务。在本报告中,爱分析将人工智能市场定义为一个更广的概念,包括了支撑人工智能开发与应用的基础设施层、技术开发层、技术服务层和行业应用层四个领域的众多细分市场。其中,基础设施层是支撑人工智能开发与...

大模型助力科技革命:2023年的里程碑与大模型的未来展望 | 社区征文

一个老程序员的计算机视觉蹒跚学习之路| 社区征文

关于开展人工智能专业人员“计算机视觉处理设计开发工程师”专项培训的通知!

计算机视觉与语音技术-相关内容

AI 助力后端开发的新趋势|社区征文

# 前言在过去几年,人工智能主要应用于自然语言处理、计算机视觉等前端开发领域。它能帮助开发者更好地理解用户需求,并提供个性化的体验。但是,随着时间的推进,我们开始注意到AI也开始渗透进入后端开发这个区域。随着微服务和无服务器计算等技术的发展,后端体系结构变得越来越分布和动态,这也给运维带来更多挑战。一方面需要高效调度资源,另一方面也面临着更多的性能问题定位。AI系统通过分析庞大的监控数据,可能可以提前发现问...

CVer从0入门NLP——GPT是如何一步步诞生的|社区征文

# CVer从0入门NLP——GPT是如何一步步诞生的|社区征文## 写在前面> Hello,大家好,我是小苏👦🏽👦🏽👦🏽>之前的博客中,我都为大家介绍的是计算机视觉的知识,随着ChatGPT的走红,越来越多的目光聚焦到NLP领域,那么今天准备和大家唠唠NLP的内容。其实呢,对于NLP,我也是初学者,之前只是有一个大概的了解,所以本系列会以一个初学者的视角带大家走进NLP的世界,如果博客中有解释不到位的地方,希望各位大佬指正。🍭🍭🍭当然了,NL...

让欺诈风险无处遁形的计算机视觉| 社区征文

通过不法手段做身份伪造和基本信息的设备更改,实现恶意骗贷等欺诈目的。(4)不良用途。当客户沉迷某些博彩、赌博活动时,资金周转出现问题时,便会大量贷款弥补亏空,此时会有骗贷或恶意不还的欺诈问题。为提升整体风险防控能力,我们在调研先进金融同业基础上,并结合自身业务特点,利用基于深度学习的计算机视觉技术在反欺诈领域做了初步探索。通过在客户贷款申请环节引入纹身、粗项链、裸露、背景相似度等视觉检测手段,根据申请贷...

短文本语音合成 10千次

多音色、多语言、多情感，享20款免费精品音色

￥15.00/年30.00/年

立即购买

流式语音识别 30小时

音频流实时识别成文字，边说话边出文字

￥35.00/年54.00/年

立即购买

录音文件识别 30小时

5小时内音频文件转写成文本，适用非实时语音识别场景

￥11.40/年19.00/年

立即购买

特惠活动

短文本语音合成 10千次

多音色、多语言、多情感，享20款免费精品音色

￥15.00/年30.00/年

立即购买

流式语音识别 30小时

音频流实时识别成文字，边说话边出文字

￥35.00/年54.00/年

立即购买

录音文件识别 30小时

5小时内音频文件转写成文本，适用非实时语音识别场景

￥11.40/年19.00/年

立即购买

产品体验

体验中心

云服务器特惠

云服务器

云服务器ECS新人特惠

立即抢购

白皮书

从ClickHouse到ByteHouse

关于金融、工业互联网，都有对应的场景特性、解决策略、实践效果具体呈现，相信一定能解决你的诸多疑惑

立即获取

计算机视觉与语音技术

语音技术

社区干货

大模型助力科技革命:2023年的里程碑与大模型的未来展望 | 社区征文

一个老程序员的计算机视觉蹒跚学习之路| 社区征文

关于开展人工智能专业人员“计算机视觉处理设计开发工程师”专项培训的通知!

计算机视觉算法探究:OpenCV CLAHE 算法详解| 社区征文

特惠活动

短文本语音合成 10千次

流式语音识别 30小时

录音文件识别 30小时

计算机视觉与语音技术-优选内容

计算机视觉与语音技术-相关内容

AI 助力后端开发的新趋势|社区征文

CVer从0入门NLP——GPT是如何一步步诞生的|社区征文

让欺诈风险无处遁形的计算机视觉| 社区征文

短文本语音合成 10千次

流式语音识别 30小时

录音文件识别 30小时

前沿视觉技术在火山引擎的应用实践

功能概览

前沿视觉技术在火山引擎的应用实践

人工智能之自然语言处理技术总结与展望| 社区征文

我的AI学习之路----拥抱Tensorflow 拥抱未来|社区征文

AI人脸检测/行为识别的8大智慧应用场景分析

特惠活动

短文本语音合成 10千次

流式语音识别 30小时

录音文件识别 30小时

产品体验

体验中心

云服务器特惠

白皮书

相关主题

最新活动

爆款1核2G共享型服务器

火山引擎增长体验专区

数据智能VeDI

热门访问

一键开启云上增长新空间