深度学习在文本-优选内容
字节跳动 EB 级 Iceberg 数据湖的机器学习应用与优化
> 深度学习的模型规模越来越庞大,其训练数据量级也成倍增长,这对海量训练数据的存储方案也提出了更高的要求:怎样更高性能地读取训练样本、不使数据读取成为模型训练的瓶颈,怎样更高效地支持特征工程、更便捷地增删... 在传统的机器学习中,特征工程是非常重要的一环,通常需要大量的人工、时间和精力来处理数据和特征。而随着深度学习的发展,我们可以利用深度学习的特征提取能力,通过简单的数据处理步骤自动学习特征,甚至可以将过程简...
2021 年我的NLP技术应用“巡径”之旅|社区征文
通过文本向量特征提取、文本实体关系抽取、文本类型识别等自然语言分析实现建筑设施运维AI场景落地是我2021年所开启新的应用领域。关于建筑运维这个传统行业如何应用自然语言NLP技术,实现机器能真正理解人类语言的技术途径,我认为作为产业界由2条技术途径可以考虑,一是,基于开源平台进行深度的开发和定制形成一个符合自己要求的AI应用平台。二是,基于成熟商业化AI平台上端侧应用开发实现企业AI应用的落地。在考察国外的Pytorch、...
人工智能之自然语言处理技术总结与展望| 社区征文
细分领域包括文本分类、命名实体识别、关系抽取、事件抽取、文本摘要、阅读理解、知识图谱构建等领域。 近些年来,基于有标记数据的监督学习是研究的重点,例如随着深度学习蓬勃发展而产生的的神经网络架构:前馈神经网络(FNN)、卷积神经网络(CNN)和循环神经网络(RNN)。但由于人工标注数据量比较少以及对没有标签的数据进行人工标注的成本比较高,所以如何更加科学的利用**大量未标记数据**以及**标记数据**则成为了新一波研究的...
语音识别-火山引擎
语音识别基于深度学习技术,将音频中的语音转成文字。可用于识别多种音频编码格式、多种场景和不同长短的语音。广泛应用于呼叫中心录音质检、会议内容总结、音频内容分析、课堂内容分析等场景
深度学习在文本-相关内容
图像处理解决方案 veImageX 技术演进之路
近日,第五届深度学习图像压缩挑战赛(以下将简称“ CLIC 大赛”)比赛结果公布,首次参赛的火山引擎视频云多媒体实验室夺得视频压缩赛道第一名。压缩技术对于图像、视频应用十分重要。在保证同样的质量前提下,如何将图... 然后动态替换文字、图片,批量生产图片,适用于海报制作、商品图片合成等场景。**离线调用**,作为图片实时分发链路的补充,这里还提供了图片算法的离线调用,包含了所有图片算法的 OpenAPI 。此外图片离线转码分析平...
使用pytorch自己构建网络模型总结|社区征文
> 🍊作者简介:[秃头小苏](https://juejin.cn/user/1359414174686455),致力于用最通俗的语言描述问题>> 🍊专栏推荐:[深度学习网络原理与实战](https://juejin.cn/column/7138749154150809637)>> 🍊近期目标:写好专栏的每一篇文章>> 🍊支持小苏:点赞👍🏼、收藏⭐、留言📩> # 写在前面 前段时间在Git上下载了yolov5的代码,经过调试,最后运行成功。但是发现对网络训练的步骤其实很不熟悉,于是乎最近看了看基于py...
能力介绍
产品简介 支持对PDF文件中的各种文本进行检测、识别和结构化解析,包含文本行文字以及图片中的文字等,得到文本内容与文本位置,满足多样化信息提取需求。 产品优势 识别准确率高: 基于海量数据与深度学习算法,PDF识别准确率处于行业领先水平。 场景覆盖全面: 支持PDF文件中的多类型文本检测与准确识别,支持多种文字格式与排版,适应倾斜、模糊等实际应用场景。 服务性能稳定: 依托云服务技术,PDF识别支持高可用性、高弹性和高并...
抖音大规模实践,火山引擎向量数据库是这样炼成的
AI时代,如何用好大模型是当前各行各业瞩目的焦点。向量数据库作为大模型“记忆体”,不仅能够为其提供数据存储,而且能通过数据检索、分析让大模型进行知识增强,成为生成式AI应用开发新范式的重要组成部分。用图片搜索图片或者文本搜索文本时,在数据库中存储和对比的并不是图片和视频片段,而是通过深度学习等算法将其提取出来的“特征”,“特征”提取的过程称为 Embedding,提取出的“特征”用数学中的向量来表示。向量化的目的是...
“柯南领结”变成现实,火山引擎发布新一代实时AI变声方案
深度学习的声音转换(Voice Conversion)技术来实现的,可以实现任意发音人的音色定制,极大程度保留原始音色的特点。 在CPU单核上就能做到极低延迟的实时输入实时变声,就像“柯南领结”一样; 能够高度还原输入语音的抑扬顿挫、情感、口音,甚至连轻微的呼吸、咳嗽声也能还原; 媲美真人的高保真音质,以及高度的目标音色一致性。 从语音合成到声音转换:探索多元声音玩法 语音合成作为人工智能的一个重要分支,旨在通过输入文字,经由人...
AI赋能安全技术总结与展望| 社区征文
热衷于机器学习算法研究与应用。曾获得阿里云天池安全恶意程序检测第一名,科大讯飞恶意软件分类挑战赛第三名,CCF恶意软件家族分类第四名,科大讯飞阿尔茨海默综合症预测挑战赛第四名,科大讯飞事件抽取挑战赛第七名,Datacon 大数据安全分析比赛第五名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。今天给大家分享的是AI赋能安全技术总结与展望,欢迎大家在评论区留言,和大家一起成长进步。# 1. 背景 伴随着人...
斩获 IPDPS 2023 最佳论文奖
Microsoft DeepSpeed-Inference等知名的深度学习库相比,ByteTransformer在可变长输入下最高实现131%的加速。论文代码已开源。论文地址:https://arxiv.org/abs/2210.03052 IPDPS: 并行和分布式计算方向计算机系统领... 实现了在BERT Transformer上的高性能表现。对于变长文本输入,相比其他Transformer实现,ByteTransformer具有明显的优势,实验中平均加速可达50%以上。适用于加速自然语言处理任务,提高模型训练与推理的效率。同时,By...