我要和大家分享的项目也是我学习AI过程中做的小项目,是利用视频分析技术结合深度学习构建的一个智能视频监控系统,用来进行实时监测和分析人员活动,提供监测识别和报警等功能,还能用于大数据分析,远程访问和管理等等... 降低分辨率等。去噪处理是因为实时视频流可能会受一些干扰,摄像头本身的噪声,光线变化等都会有影响,不能放过这些细节。去噪处理后也能获得更高质量的视频流。```#读原始帧frame = cv2.imread("original_frame....
**Webhook+腾讯人体识别+表单系统:**当webhook接收监控系统传来的数据时,腾讯人体识别自动搜索人体,在人体库中识别TopK人体,按照相似度从小到大排列同步到表单系统中,便于公安机关/景区/零售店等相关人员查看15**腾讯OCR** 文字识别(OCR)基于腾讯优图实验室世界领先的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和...
随着深度学习等技术的崛起,我们目睹了语音识别、人脸识别、自然语言处理等领域的惊人进展。这些技术不再停留在研究实验室,而是渗透到了我们生活的方方面面。AI语音助手的崛起成为了数字时代的代表之一。小爱同学作... 基本能够实时地转换语音为文字。这种流畅性使得用户能够更加专注于内容的创作,而无需在键盘和鼠标之间频繁切换。## 小米的小爱同学 ![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tldd...
**边缘ML:** 是指机器学习在不处于核心数据中心的,企业级计算机/设备中的应用。边缘设备包括服务器机房,现场服务器,以及位于各个地区以加快响应速度为目的的小型数据中心。云端和边缘端的ML 已经通过3年多的科普,广为大众所接受。今天我们看到的人脸门禁、摄像头行为识别、智能音箱...... 绝大部分场景都属于这两类。 以 TensorFlow & TF lite 等开源深度学习框架为基础的大量应用,推动了智能在云端和边缘端应用。然而,更加具有...
**边缘ML:** 是指机器学习在不处于核心数据中心的,企业级计算机/设备中的应用。边缘设备包括服务器机房,现场服务器,以及位于各个地区以加快响应速度为目的的小型数据中心。云端和边缘端的ML 已经通过3年多的科普,广为大众所接受。今天我们看到的人脸门禁、摄像头行为识别、智能音箱...... 绝大部分场景都属于这两类。 以 TensorFlow & TF lite 等开源深度学习框架为基础的大量应用,推动了智能在云端和边缘端应用。然而,更加具有...
**文字创作**AIGC 生成文字目前主要被应用于新闻的撰写、给定格式的撰写以及风格改写。比如用户可以通过输入一段对于目标文章的描述或者要求,系统会自动抓取数据,根据我们描述的指令进行创作。**图像创作**技术... 其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为 AIGC 发展的“加速度”。# “智能诗歌生成”的AIGC项目我曾参与了一个名为“智能诗歌生成”的AIGC项目。该项目的主要目标是利用人工智...
深度神经网络设计优化策略,如何结合 Transformer 大模型的特性做针对性的优化有待进一步研究。![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/6d1fd6a54f3b4a5eb6aa88a652eb6ffc~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1714926064&x-signature=Nr48ch97lRP8MDPSkMaZ7iKMdsE%3D)# 项目分享下面我给大家分享一个基于预训练模型的命名实体识别(NER)应用:1.安装所需库...
> 深度学习的模型规模越来越庞大,其训练数据量级也成倍增长,这对海量训练数据的存储方案也提出了更高的要求:怎样更高性能地读取训练样本、不使数据读取成为模型训练的瓶颈,怎样更高效地支持特征工程、更便捷地增删... 虽然学习特征的能力已经很强了,但目前还需要分词组件辅助将文字转换为模型理解的形式,并且分词的好坏也会一定程度影响模型的效果。而现阶段各个大语言模型的分词算法还不一样,距离完全的端到端还有一定距离,基本都...
深度学习正是 AI 的特点。再比如说 智能语音交互(Intelligent Speech Interaction),就是你所理解的基于语音识别、语音合成、自然语言理解等技术,对于企业来说适用于智能问答、智能质检、法庭庭审实时记录、实时演... AIGC 对于文字工作者或者是服装设计以及其他图片设计,是否就能为其提供灵光闪现呢?推广开来,和文字有关,和图片有关的是不是就可以借助 AI 的辅助做的更好呢?## 虚拟数字人既然有了文生图,图生文,文生视频,音频...
在学习AI的过程中,我深入了解了机器学习、深度学习、自然语言处理等关键技术,并对其在各个领域的应用有了更深刻的认识。## 🐬1.1 AIGC大模型学习体验有感说到总结,我觉得第一条就应该说一下现在爆火的Chatgpt了... AI技术的突破将赋予自动驾驶车辆更强大的环境识别能力。通过机器学习和深度学习,车辆将能够自主判断路况、预测其他车辆和行人的行为,并作出相应的驾驶决策。这将大大提高道路安全和乘车舒适度。自动驾驶技术将成...
深度学习也在其中起着重要作用。不知道小伙伴们熟不熟悉工业领域的缺陷检测腻?🧐🧐🧐今天就以钢轨表面缺陷为例,和大家唠唠基于深度学习的钢轨表面伤损细粒度图像识别与目标检测,***总结一下工业缺陷检测流程***,包... 分辨率、覆盖类别、目标密度还有小目标代表方面都远远优于现有的类似数据集。有了数据集之后,用它去训练目标检测算法,我在这里使用的是yolov5进行迁移学习,得到一个基准模型。对这个基准模型的各类目标进行详细的性...
深度学习方法能以更方便的方式对特征进行提取,在图像分类、人工智能等领域取得了良好的效果。近些年来,一些研究人员开始将深度学习方法应用于癫痫发作检测领域。# 方法## 1融合GCN和transformer的癫痫自动检测... 输入源语言文字,把目标语言文字输出出去。将 Transformer 中的 Encoder 结构单独提取出来。可以作为较强的特征提取网络,后又在计算机视觉、多模态等领域都取得了不错的成绩,并逐渐扩展到其他领域。目前针对于脑电信...
* 人脸识别* 通用文字识别* 身份证识别* 银行卡识别* 营业执照识别* 护照识别* 智能财务税票识别* 行驶证识别* 驾驶证识别* 试卷分析与识别* 公式识别* 仪器仪表盘读数识别 **新增集成应用-百度TTS** 百度TTS是基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务,支持在线、离线多种调用方式...