You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

计算机视觉与语音技术专业

生成基于语音识别的智能字幕服务,可以自动将视频中的语音和歌词快速转换成字幕

社区干货

一个老程序员的计算机视觉蹒跚学习之路| 社区征文

### 一、前言 老猿是个 C++的老程序员,到底有多老呢,估计现在各平台发技术文章的博主中,很难有年龄比老猿大的。程序员这个活,是年轻人干的,并不怎么适合象我这种年纪的人,工作中也很少需要自己动手开发的。 2019 年,各种因缘际会,老猿想学习一下 Python,4 月入住国内某程序员汇聚的知��

关于开展人工智能专业人员“计算机视觉处理设计开发工程师”专项培训的通知!

**2024年企业和个人都在报考的,由工信部颁发的AI人工智能证书!********《计算机视觉处理设计开发工程师》** **2024年** **1月24日至28日** **-** **北京******为进一步贯彻落实中共中央印发《关于深化人才发展体制机制改革的意见》和国务院印发《关于“十四五”数字经济发展规划》等有关工作的部署求,深入实施人才强国战略和创新驱动发展战略,加强全国数字化人才队伍建设,持续推进人工智能专业人员能力培养和评价,工业和信...

我的AI学习之路----拥抱Tensorflow 拥抱未来|社区征文

![全力以赴 步履不停.png](https://p9-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/70a9d046587f408bb7b65156e668cef5~tplv-k3u1fbpfcp-5.jpeg?) > `前言:` “Hello,大家好我叫是Dream呀!” 不知不觉,这句话已经陪伴了我一年多了。也许你是第一次听,但这并没有关系,因为时间无言,相遇即缘!😜 # 写在前面 2020年10月08日,我正式接��

大模型助力科技革命:2023年的里程碑与大模型的未来展望 | 社区征文

以增加模型的表示能力和学习能力。大模型的诞生影响,对如今发展的许多领域,诸如自然语言处理、计算机视觉和语音识别等等,都有着显著的成果!![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/179ca2b2f7ed4720b5485a4dbb3c3e69~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1716049273&x-signature=PG8%2Fv%2FnNgkVh%2FoTx9zREmspw0aw%3D)# 一. 大模型所采用的高级技术0. 深度...

特惠活动

短文本语音合成 10千次

多音色、多语言、多情感,享20款免费精品音色
15.00/30.00/年
立即购买

流式语音识别 30小时

音频流实时识别成文字,边说话边出文字
35.00/54.00/年
立即购买

录音文件识别 30小时

5小时内音频文件转写成文本,适用非实时语音识别场景
11.40/19.00/年
立即购买

计算机视觉与语音技术专业-优选内容

一个老程序员的计算机视觉蹒跚学习之路| 社区征文
### 一、前言 老猿是个 C++的老程序员,到底有多老呢,估计现在各平台发技术文章的博主中,很难有年龄比老猿大的。程序员这个活,是年轻人干的,并不怎么适合象我这种年纪的人,工作中也很少需要自己动手开发的。 2019 年,各种因缘际会,老猿想学习一下 Python,4 月入住国内某程序员汇聚的知��
关于开展人工智能专业人员“计算机视觉处理设计开发工程师”专项培训的通知!
**2024年企业和个人都在报考的,由工信部颁发的AI人工智能证书!********《计算机视觉处理设计开发工程师》** **2024年** **1月24日至28日** **-** **北京******为进一步贯彻落实中共中央印发《关于深化人才发展体制机制改革的意见》和国务院印发《关于“十四五”数字经济发展规划》等有关工作的部署求,深入实施人才强国战略和创新驱动发展战略,加强全国数字化人才队伍建设,持续推进人工智能专业人员能力培养和评价,工业和信...
我的AI学习之路----拥抱Tensorflow 拥抱未来|社区征文
![全力以赴 步履不停.png](https://p9-juejin.byteimg.com/tos-cn-i-k3u1fbpfcp/70a9d046587f408bb7b65156e668cef5~tplv-k3u1fbpfcp-5.jpeg?) > `前言:` “Hello,大家好我叫是Dream呀!” 不知不觉,这句话已经陪伴了我一年多了。也许你是第一次听,但这并没有关系,因为时间无言,相遇即缘!😜 # 写在前面 2020年10月08日,我正式接��
大模型助力科技革命:2023年的里程碑与大模型的未来展望 | 社区征文
以增加模型的表示能力和学习能力。大模型的诞生影响,对如今发展的许多领域,诸如自然语言处理、计算机视觉和语音识别等等,都有着显著的成果!![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/179ca2b2f7ed4720b5485a4dbb3c3e69~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1716049273&x-signature=PG8%2Fv%2FnNgkVh%2FoTx9zREmspw0aw%3D)# 一. 大模型所采用的高级技术0. 深度...

计算机视觉与语音技术专业-相关内容

大模型和深度学习的工作总结|社区征文

![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/44b74ab4861f41bb8b8defb68ffb7e98~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1716049248&x-signature=K%2BPUPnCoSjqdylo1F%2B77RQQgr00%3D) **前言** 在 2023 年疫情早已结束的当下,时代也在飞速的发展和进步,越来越多的技术:深度学习、AI、大模型、虚拟现实VR等慢慢�

计算机视觉算法探究:OpenCV CLAHE 算法详解| 社区征文

### 一、引言2021 年 10 月开始学习 OpenCV 对比度受限的自适应直方图均衡 CLAHE,应用编程简单,了解详细算法却相当难。创建 CLAHE 对象时,只传递了两个参数:clipLimit 和 tileGridSize,其中 clipLimit 是裁剪限制参数,tileGridSize 图像的分块个数。关于参数含义及相关的介绍请参考《[OpenCV-Python自适应直方图均衡类CLAHE及方法详解](https://blog.csdn.net/LaoYuanPython/article/details/120850922)》。**CLAHE 算法的...

AI 助力后端开发的新趋势|社区征文

# 前言 在过去几年,人工智能主要应用于自然语言处理、计算机视觉等前端开发领域。它能帮助开发者更好地理解用户需求,并提供个性化的体验。但是,随着时间的推进,我们开始注意到AI也开始渗透进入后端开发这个区域。 随着微服务和无服务器计算等技术的发展,后端体系结构变得越来越分布和动态,这�

短文本语音合成 10千次

多音色、多语言、多情感,享20款免费精品音色
15.00/30.00/年
立即购买

流式语音识别 30小时

音频流实时识别成文字,边说话边出文字
35.00/54.00/年
立即购买

录音文件识别 30小时

5小时内音频文件转写成文本,适用非实时语音识别场景
11.40/19.00/年
立即购买

CVer从0入门NLP——GPT是如何一步步诞生的|社区征文

# CVer从0入门NLP——GPT是如何一步步诞生的|社区征文## 写在前面> Hello,大家好,我是小苏👦🏽👦🏽👦🏽>之前的博客中,我都为大家介绍的是计算机视觉的知识,随着ChatGPT的走红,越来越多的目光聚焦到NLP领域,那么今天准备和大家唠唠NLP的内容。其实呢,对于NLP,我也是初学者,之前只是有一个大概的了解,所以本系列会以一个初学者的视角带大家走进NLP的世界,如果博客中有解释不到位的地方,希望各位大佬指正。🍭🍭🍭当然了,NL...

AIBP,我的下一个职业规划|社区征文

写在前面:2024年,AIBP,这是我的一个新的职业目标。 我是法老猫,一个想养猫又心疼家具,只能起名法老猫的人。十二年政务行业软件从业者,做过开发、项目经理、技术团队管理。目前正在做大模型相关的产品应用。 记得一月份的时候同事问我:“你知道ChatGPT么?”,那时我只是从零碎的新闻里�

开放的AI基建,让AI普惠更进一步

在刚刚结束的2022火山引擎FORCE原动力大会上,火山引擎发布了全新的机器学习平台和推荐平台的多云部署解决方案,其能够应用于科研开发、运营优化等场景中,为更多用户提供全面且领先的数智化系统服务。 火山引擎机器学习系统负责人项亮在解释统一、开放的AI基建时,表示企业希望能够赋能算法�

2023 总结对AI的总结和展望|社区征文

然后传给计算机解析,然后计算机根据不同的语言去检索对应的结果,当然你可以理解为他就是一个简单的查数据库一样,就像SQL查数据库,但是他比SQL查查数据库还要复杂一点,他会有一些语法解析的动作在里面。# 向量数据... 他就会根据相似度匹配来实现一个高效的数据查询和分析。首先当你存储数据的时候,他会把一些文档图像音频会转换成一各一各不同的向量,然后当你去向的GPT描述你的需求的时候,他会解析把你的语音解析解析什不同不同的...

文本向量化模型新突破——acge_text_embedding勇夺C-MTEB榜首

在人工智能的浪潮中,以GPT4、Claude3、Llama 3等大型语言模型(LLM)无疑是最引人注目的潮头。这些模型通过在海量数据上的预训练,学习到了丰富的语言知识和模式,展现了出惊人的能力。在支撑这些大型语言模型应用落地方面,文本向量化模型(Embedding Model)的重要性也不言而喻。 近期,我在浏览hu

人工智能之自然语言处理技术总结与展望| 社区征文

  大家好,我是 herosunly。985 院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池安全恶意程序检测第一名,科大讯飞恶意软件分类挑战赛第三名,CCF 恶意软件家族分类第四名,科大讯飞阿尔茨海默综合症预测挑战赛第四名,科大讯飞事件抽取挑战赛第七�

特惠活动

短文本语音合成 10千次

多音色、多语言、多情感,享20款免费精品音色
15.00/30.00/年
立即购买

流式语音识别 30小时

音频流实时识别成文字,边说话边出文字
35.00/54.00/年
立即购买

录音文件识别 30小时

5小时内音频文件转写成文本,适用非实时语音识别场景
11.40/19.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

从ClickHouse到ByteHouse
关于金融、工业互联网,都有对应的场景特性、解决策略、实践效果具体呈现,相信一定能解决你的诸多疑惑
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询