Data Agent 产品名词解释--数据智能体 DataAgent（私有化）-火山引擎

文档中心

数据智能体 DataAgent（私有化）

快速入门

Data Agent 产品名词解释

Data Agent 产品名词解释

本文档介绍 Data Agent 相关名词的含义，以便于您更好地理解和使用产品。

智能体

名称	术语含义	别名
智能体	基于大语言模型（LLM）构建的AI系统，能够理解自然语言、执行任务并通过对话与用户交互，具备自主决策和学习能力。在本产品中指的是智能分析 Agent 或智能营销 Agent。	Agent
智能分析 Agent	智能分析 Agent 是一款基于AI深度思考与大数据分析的专家顾问，融合大模型深度思考能力，兼顾灵活智能问数与深度研究报告功能。	分析 Agent
智能营销 Agent	智能营销 Agent 是一款依托 AI 深度思考能力与大数据分析技术构建的综合性数字营销智能工具，整合了营销互动助手与智能营销策略两大核心模块。	营销 Agent
营销互动助手	营销互动助手是一款融合实时客户画像洞察与AI决策引擎的对话式营销中枢，通过购买意向识别、智能话术生成、精准商品推荐和全链路任务自动化实现从客户需求解析、权益推荐到档案更新的全场景智能交互，以多系统协同的闭环管理提升客户转化效率与经营精细度。	无
智能营销策略 Agent	智能营销策略 Agent 是一款基于AI深度思考与大数据分析的数字营销决策中枢，通过“目标输入-策略生成-任务配置-动态优化“的智能闭环，实现从营销要素解析、智能圈群匹配到全渠道策略输出的全流程自动化，为企业打造具备秒级响应与持续进化能力的"AI总参谋"决策系统。	无
自然语言	人类日常使用的语言（如中文、英文），智能体通过理解和生成自然语言实现人机交互。	无
Prompt	用户输入给智能体的指令或问题，用于引导其生成特定响应或执行任务，设计质量直接影响输出效果。	提示词、指令输入
大模型	参数量巨大的预训练语言模型（如豆包），具备强大的自然语言理解和生成能力，是智能体的核心基础。	LLM、大语言模型
企业知识引擎	是智能体的专属知识中枢，集中存储、管理企业各类知识资产，为智能体提供知识支撑。智能分析Agent与智能营销Agent均具备企业知识引擎功能。智能分析Agent中：企业知识引擎是深度研究Agent的专属知识中枢，支持上传企业私有文档，通过智能匹配与结构化提取，将内部知识精准注入分析流程。与联网搜索形成互补，确保研究结论兼具时效性与业务深度。智能营销Agent中：企业知识引擎是营销互动助手的底层能力，提供全流程知识构建、管理能力与智能化AI应用能力，支持企业级用户构建通用企业知识引擎、定制AI应用，并通过精细化权限管理保障数据安全。包含通用企业知识引擎与主体企业知识引擎。	知识库
知识配置	知识配置指为智能分析 Agent 的企业知识引擎配置知识的过程，支持上传企业私有化文档。配置的知识将会被自动打标为三种类型：业务知识、分析框架和分析报告。	无
语义模型	对数据集元信息（名称、字段等）进行业务语义标注和映射的模型，用于提升智能体对数据的理解和问答准确性。	无
非结构化数据	无固定格式的数据（如文本、图像、视频），智能体需借助多模态技术处理此类数据。	异构数据
向量化	将数据转换为数值向量（嵌入表示），使智能体能够计算语义相似度和进行高效检索。	嵌入表示、Embedding
对话	智能体与用户通过多轮自然语言交互完成任务的过程，需维护上下文一致性以实现连贯交流。	会话

数据集

名称	术语含义
数据集	数据集指由一张或多张表组成的数据模型，是智能体的数据来源，在为智能体配置数据前，需要在“数据集”模块建立数据连接，将数据接入 Data Agent，并完成数据向量化。
全量表	全量表是一种数据存储或分区方式，其核心特征是：在数据的每个分区（通常按日期等时间维度划分）中，存储的是截至该分区对应日期时，研究对象或业务实体的全部最新状态数据。
增量表	增量表是与全量表相对的一种数据分区方式，其特点是：在每个分区（通常按时间周期划分）中，仅存储该周期内新增或发生变更的数据，而非截至该周期的全部数据。
关联数据集	关联数据集指通过字段匹配实现关联的多个数据集，可依据业务场景联合使用，进而形成满足自身数据需求的数据集。
字段	字段包含维度和指标两种属性。维度是划分分析数据的视角，为非聚合状态的字段（如日期、作者 UID 等）；指标是通过不同聚合方式对数据进行量度的属性，多以数字形式呈现（如作者投稿数）。
表达式	表达式可通过 SQL 编写，用于获取目标数据。例如，原表有字段 price（值为 19.99），用 round (price) 可得到整数金额字段 rounded_price（值为 20）。
函数	函数是数据处理过程中可调用的预定义操作指令，用于实现各类数据处理功能，如上述表达式中用于时间转换的 toMonth 和 toDateTime 函数。
同步	将指定数据库的数据定期搬运到 Data Agent 数据库中。定时同步：可以自行设置起始时间定时对数据进行同步，支持同步历史数据。手动同步：仅首次同步，后续不再自动更新；如需同步则需手动点击「同步」按钮。
依赖	依赖是指在数据处理相关流程中，不同节点或任务之间存在的关联性，这种关联性决定了任务的执行顺序和条件，以保障数据处理的有序性和有效性。其主要分为调度依赖和推荐依赖两种类型。调度依赖通常是指数据同步、数据开发过程中周期调度节点间的上下游依赖关系。通过节点的依赖关系有序调度任务运行上下游节点，即当上游节点运行成功后，下游节点才会启动运行，保障适时的产出有效业务数据。推荐依赖是指在带分区的 LAS 数据源中，系统能自动构建数据源分区探测任务，自动配置调度依赖。当检测任务检查到上游分区就绪的时候，才会实际的触发当天的任务实例的运行（不带分区的数据源不支持此依赖类型）。
参数	参数为可灵活调整的变量，可应用于计算字段，实现单个计算字段乃至整个图表的动态逻辑方案。当参数取值不同时，字段表达式对应的计算逻辑亦会不同。
主键	主键是数据集里用于唯一标识每条记录的字段或字段组合。设置主键后，能快速定位和检索数据，从而提升查询效率。
分区	分区是将数据集按照特定规则（如时间、地域等）从物理存储上划分为多个独立部分的机制。通过分区，可减少查询时需扫描的数据量，分散系统处理压力，提升数据查询与管理效率，尤其适用于大规模数据集。
分片	分片是将数据集依据分片字段的规则，在分布式存储环境中拆分并均匀分布到多个节点的方式。其核心目的是避免数据集中存储导致的性能瓶颈，通过多节点并行处理提升数据查询和处理速度。
抽样字段	抽样字段是在对数据集进行抽样查询时，作为数据抽样依据的特定字段。系统默认基于该字段进行 HASH 运算来选取部分数据样本，以此在保证查询结果具有一定代表性的同时，减少数据处理量，提升查询响应速度。
抽样占比	抽样占比是指在可视化查询中，基于抽样字段抽取的数据样本量占数据集总数据量的比例。该比例越小，抽取的样本数据量越少，查询时的计算与传输负载越低，可视化查询的响应速度也就越快。
数据生命周期	数据生命周期是指数据集从产生到被清理的整个过程中，系统依据预设的日期规则（如保留时长、清理周期等）自动对无用或过期数据进行清理的管理机制，旨在合理释放存储资源，保障系统高效运行。

可视化建模

名称	术语含义	别名
数据建模	按照某种数据处理逻辑将元数据数据清洗、加工及生产的过程叫做数据建模。	数据加工
画布	可视化建模的核心界面，支持通过拖拽算子并建立连接关系来构建数据处理流程。	无
算子	画布中的功能模块单元，提供数据输入、加工、计算或输出等特定能力，以方块形式呈现。	无
连线	画布中连接两个算子的有向箭头，表示数据流动的方向和依赖关系。	无
数据集	是数据准备的基础建模工具，提供基础的多表关联的数据建模能力，同时也是可被产品使用的数据容器，包含ClickHouse数据集/Hive数据集。	无
实时任务	对持续更新的数据流进行即时处理和计算的可视化建模任务，通常用于实时分析场景。	流式任务
离线任务	基于周期更新的数据源（如天级/小时级）执行的可视化建模任务，依赖定时或手动触发运行。	无

数据连接

名称	术语含义	别名
数据连接	用于配置与外部数据源的通信参数，建立系统与数据库/数据服务的连接通道，是数据查询、分析和建模的前提条件。	数据源接入
数据源	提供数据的存储系统或服务，包括关系型数据库、NoSQL 等，需通过数据连接配置才能访问。	数据库
抽取	将数据从源系统（如数据库、文件、API等）提取并传输到目标存储或计算引擎的过程。离线抽取：将数据离线抽取到 Data Agent 内置高性能存储计算引擎中，目前支持的大部分数据库都默认支持离线抽取。实时抽取：将数据实时抽取到引擎中存储，仅支持 Kafka、Pulsar 数据源等。	无
直连	直接访问源数据库执行查询，利用数据库原生计算能力，避免数据迁移开销。	无
服务器	提供数据服务的物理或虚拟主机的网络地址，是数据连接配置的核心参数之一。	主机、IP地址
端口	服务器上用于特定服务通信的网络端口号（如MySQL默认3306），与服务器地址共同构成连接端点。	通信端口
VPC	虚拟私有云（Virtual Private Cloud），为数据连接提供隔离的网络环境，保障数据传输安全性。	私有网络、专有网络

项目中心

名称	术语含义
项目	系统中独立的业务工作空间，基于业务主题或部门划分，提供资源隔离和权限控制。项目成员可在此空间内协作完成数据连接、可视化建模、数据预览等操作。
项目资源	归属于特定项目的所有实体对象，包括数据集、数据连接、可视化任务、仪表盘等，受项目权限体系管控。
用户组	具有相同权限角色的用户集合，用于批量管理项目成员的数据访问和操作权限。

权限

名称	术语含义	别名
系统	系统指的是整个火山引擎系统。	火山引擎
产品	产品指的是 Data Agent 产品。	DataAgent
主账号	主账号可以看作是一个特殊的用户（被称为根用户，root user），是云服务资源的拥有者，也是资源计量、资源计费的主体。主账号默认拥有账号下所有权限。	主用户、系统管理员
子账号	子账号，是由火山引擎账号（主账号）或具有管理权限的 IAM 用户创建。	子用户
行权限控制	通过数据过滤条件限制用户对数据集特定行的访问权限（如仅允许查看本部门数据），实现数据行级安全管控。	RLS（Row-Level Security）
列权限控制	通过字段黑白名单限制用户对数据集特定列的访问权限（如屏蔽敏感字段），实现数据列级安全管控。	CLS（Column-Level Security）

最近更新时间：2025.12.16 19:53:18

这个页面对您有帮助吗？

有用

有用

无用

无用