自研了具有完全知识产权的基于深度学习的企业级智能OCR平台。## 2. 解决方案我司的企业级智能OCR平台的整个架构均为自主研发。针对业务部门提出的多种OCR需求,如下图1所示,我司以所在企业内部的图片、PDF文件、视... 我司分别部署了多项图片及文档OCR识别服务、OCR自主配置与标注平台、智能化录入与自动化比对应用,以便为客户提供多样化、个性化服务。目前,该平台自研OCR服务可支持业务场景共18种,可识别证件三十余种,整体实现了对...
为大家详细介绍我是如何使用深度学习与视频分析技术构建项目的。# 项目细节## 需求分析这可能是一个与本文主题关联不大的模块,为了能让读者清楚了解项目背景,就简单总结几点项目需求。首先在功能方面,系统大致需要能解码视频并提取关键帧用于人脸检测和行为识别,并且要能展示分析结果,包括标注人脸和行为,还能够实时报警。系统性能方面,要在实时场景下对大量视频数据进行处理和分析,所以需要有高效的算法和硬件支持,简而言...
绝大部分场景都属于这两类。 以 TensorFlow & TF lite 等开源深度学习框架为基础的大量应用,推动了智能在云端和边缘端应用。然而,更加具有广大前景的应用,应该属于下面这一类:**TinyML:** 是指超低功耗的机器学... 如何使用PyTorch框架对深度学习模型进行训练和优化,以及如何将模型部署到边缘设备上? 以下是我的答案```pythonimport torch import torch.nn as nn import torch.optim as optim from torch.utils.mobile_...
这对需要实时反馈的应用场景(如自动驾驶、远程医疗等)至关重要。高效:边缘计算能彻底解决海量信息,减轻云计算核心压力,提高总体数据处理效率。灵活性:因为设备层和边缘服务器层分布式特点,边缘计算可以灵活地满足不同主要用途与需求。可靠性:由于数据在设备边缘的处理与应用,减少了内容遗失的风险,提高了系统的可靠性。# 4.边缘计算的应用场景智慧交通:在交通系统中,车辆会产生大量实时动态(如部位、速率、路况等)。依...
[picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/44b74ab4861f41bb8b8defb68ffb7e98~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1716135649&x-signature=sFMepW89k1jBxck9LHvULe0l%2BPQ%3D)**前言**在 2023 年疫情早已结束的当下,时代也在飞速的发展和进步,越来越多的技术:深度学习、AI、大模型、虚拟现实VR等慢慢进入我们的生活。**基于大模型的图像去雾**在今年这个阶段...
在学习AI的过程中,我深入了解了机器学习、深度学习、自然语言处理等关键技术,并对其在各个领域的应用有了更深刻的认识。## 🐬1.1 AIGC大模型学习体验有感说到总结,我觉得第一条就应该说一下现在爆火的Chatgpt了... 可以学习到模型的可调性和灵活性,是能够更好地适应不同的应用场景的。● 成功在Canvas中构建一个机器学习模型,该模型能够根据历史数据预测交付是否准时或延迟。其准确率超过了80%,从而有效地预测货物的交付状态,...
# beginning2023年可谓是人工智能浪潮翻涌的一年,AI在各个领域遍地开花。以我最熟悉的工业为例,深度学习也在其中起着重要作用。不知道小伙伴们熟不熟悉工业领域的缺陷检测腻?🧐🧐🧐今天就以钢轨表面缺陷为例,和大... 那么它在大多数类别的性能上是不如迁移学习滴🌻🌻🌻所以这就告诉我们,哪怕是你用yolo解决完全不一样的图像域,人家原始的yolo是在自然图像上训练的,而现在我们要解决钢轨表面伤损的问题,仍然是能够借鉴自然图像训练...
文本类型识别等自然语言分析实现建筑设施运维AI场景落地是我2021年所开启新的应用领域。关于建筑运维这个传统行业如何应用自然语言NLP技术,实现机器能真正理解人类语言的技术途径,我认为作为产业界由2条技术途径可以考虑,一是,基于开源平台进行深度的开发和定制形成一个符合自己要求的AI应用平台。二是,基于成熟商业化AI平台上端侧应用开发实现企业AI应用的落地。在考察国外的Pytorch、tesorflow和国内PaddlePaddle、Volcengine等...
这个大模型擅长的角度来验证大模型能否更深度提升个人工作效率。![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/348f356e262044e781fa8696ba0014ed~tplv-tlddhu82om-image.i... import torchfrom transformers import BertTokenizer, BertForTokenClassification```导入PyTorch和Hugging Face的Transformers库,并加载预训练的BERT模型和tokenizer。```pythonmodel_name = "bert-base-u...
> 深度学习的模型规模越来越庞大,其训练数据量级也成倍增长,这对海量训练数据的存储方案也提出了更高的要求:怎样更高性能地读取训练样本、不使数据读取成为模型训练的瓶颈,怎样更高效地支持特征工程、更便捷地增删... 并且使得 GPT-3 在自然语言处理任务中取得了令人瞩目的成就。 然而随着模型参数的增长,模型的大小也成为一个问题。为了解决这个问题,人们开始尝试模型小型化的方法。Chinchilla 就是一种模型小型化的尝试,相...
一方面用于场景和故事的搭建,另一方面玩家可以通过 AIGC 的平台工具来创建自己的虚拟人,可以用于游戏中的打金等活动。**代码生成**资料显示,2022 年 AIGC 发展速度惊人,迭代速度更是呈现指数级爆发,其中深度学习模型不断完善、开源模式的推动、大模型探索商业化的可能,成为 AIGC 发展的“加速度”。# “智能诗歌生成”的AIGC项目我曾参与了一个名为“智能诗歌生成”的AIGC项目。该项目的主要目标是利用人工智能技术生成具有...
深度学习方法能以更方便的方式对特征进行提取,在图像分类、人工智能等领域取得了良好的效果。近些年来,一些研究人员开始将深度学习方法应用于癫痫发作检测领域。# 方法## 1融合GCN和transformer的癫痫自动检测... Google在顶级机器学习会议上发表了论文“Attention is all you need”提出了 Transformer,一种自注意力机制来学习文本的表示。Transformer 是一个标准的编码--解码结构,包括一系列编码与解码器的堆叠,在自然语言处...
百度TTS是基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务,支持在线、离线多种调用方式,满足泛阅读、订单播报、智能硬件等场景的语音播报需求。 官网:https://ai.baidu.com ![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/8d7d92665f824bc9aaa290701b9f4f84~tplv-tlddhu82om-image.image?=&rk3s=8031ce6d&x-expires=1716135618&x-signature=I6qWMbQ...