基本配置--大数据研发治理套件（私有化）-火山引擎

文档中心

大数据研发治理套件（私有化）

实时分库分表

基本配置

实时分库分表同步方案基本配置参数说明如下。

基本信息

基本配置参数说明如下表所示。其中名称前带 * 的参数为必填参数，名称前未带 * 的参数为可选参数。
基本配置说明：

配置项	说明
*链路类型	下拉选择来源和目标端数据源类型。来源支持类型： MySQL（同时支持TDSQL的数据源类型）目标支持类型：LAS、Doris、StarRocks
*方案名称	输入实时分库分表同步方案名称。只允许字母、数字、下划线、连字符，且仅允许输入 1~63 个字符。说明解决方案实际生成的任务名称定义：流任务名称：方案名称_解决方案 ID；批任务名称：解决方案名称_解决方案 ID_唯一标识UUID(12位)。
方案描述	输入此方案的描述信息，方便后续维护管理。
*保存至	下拉选择方案保存路径，此路径为数据开发项目中的任务路径。创建方式详见“任务目录树管理”。

网络与资源配置

在网络与资源配置中，配置数据来源/目标端数据源信息、集成资源组信息。其中名称前带 * 的参数为必填参数，名称前未带 * 的参数为可选参数。
网络与资源配置说明：

配置项	说明
*数据来源	下拉选择数据源管理中创建成功的源端数据源名称，支持选择多个。若此前仍未创建相应数据源，您可单击左侧导航栏中的数据源管理按钮，前往数据源管理界面，进行数据源的创建。详见“注册数据源”。说明目前对于 JDBC 类火山引擎数据源类型，您可通过批量新增数据源的方式，进行批量创建，单次最多创建 200 个数据源：单击批量新建数据源按钮，进入新建窗口。单击下载模板按钮，在 Excel 模版中，配置数据源相关的数据源名、RDS 实例ID、数据库名、用户名密码等信息。 Excel 中数据源信息填写完成后，单击立即上传 > 确定新增，完成数据源批量新增。
数据缓存	选择实时同步解决方案执行过程，采集数据时是否使用缓存配置方式：若勾选使用数据缓存，目前仅支持通过Kafka数据源缓存，下拉选择已创建成功的Kafka数据源；若不使用，则无需选择缓存数据源。缓存说明详见“数据缓存配置”。
*数据目标	下拉选择数据源管理中创建成功的目标端数据源名称。
*绑定引擎	默认展示当前项目下已绑定的 Apache Hadoop、MiniBase Hadoop、或LAS引擎。
*关联实例	关联实例：选择引擎下对应的引擎实例信息。
*离线/实时队列（离线全量/实时增量）	下拉选择DataLeap项目控制台 > 资源管理中已绑定的队列信息，队列操作详见“资源管理”。队列信息选择完成后，您可单击下方的测试连通性按钮，测试选择的队列是否可以和各数据源连通成功。

资源组高级配置

您可在资源组高级配置中，配置离线全量同步、实时增量同步等运行配置信息。

离线全量同步
设置解决方案中离线全量任务的运行参数情况。
其中名称前带 * 的参数为必填参数，名称前未带 * 的参数为可选参数。
离线全量运行配置说明

配置项	说明
*队列	选择任务执行的 Yarn 队列信息，您可下拉选择资源管理平台中所添加的 Yarn 队列信息。队列操作详见“资源管理”。
*默认Quota数	设置可同时提交执行的集成任务数量，可根据环境配置中Yarn队列规格进行配置。如队列规格为40CU，则Quota配置需小于20（40/2），超出时，会因资源问题导致任务执行异常。说明您也可按需勾选“每次提交执行时不询问”选项，建议您勾选。若不勾选，方案每次提交执行时，在执行详情 > 任务 Quota 检测步骤中，需要人工进行 Quota 数确认。
*期望最大并发数	设置离线任务同步时，可以从源端并行读取或并行写入目标端的最大线程数。并发数影响数据同步的效率，并发设置越高对应资源消耗也越多，由于资源原因或者任务本身特性等原因，实际执行时并发数可能小于等于设置的期望最大并发数。
集成高级参数设置	打开高级参数输入按钮，根据实际业务要求，以 Key\Value 形式，在编辑框中输入离线任务所需的高级参数。参数配置详见“高级参数设置”中自定义参数设置说明。

实时增量同步
设置解决方案中实时增量任务的运行参数情况。
其中名称前带 * 的参数为必填参数，名称前未带 * 的参数为可选参数。
实时增量运行配置说明

配置项	说明
*队列	选择任务执行的 Yarn 队列信息，您可下拉选择资源管理平台中所添加的 Yarn 队列信息。队列操作详见“资源管理”。
*资源设置	可通过自定义和默认两种设置方式，进行实时任务运行资源的设定，如单TaskManager CPU数量、单TaskManager内存大小、JobManager CPU数量等。说明默认设置中，各运行资源设置如下：单TaskManager CPU 数：2 单 TaskManager 内存：4096 MB 单 TaskManager slot 数：4 JobManager CPU 数：1 JobManager 内存：2048 MB
集成高级参数设置	打开高级参数输入按钮，根据实际业务要求，以 Key\Value 形式，在编辑框中输入实时任务所需的高级参数。参数配置方式详见“参数设置”中自定义参数设置说明。
Flink运行参数设置	支持输入 Flink 相关的动态参数和执行参数，具体参数设置详见 Flink 官方文档。如支持通过设置 Flink 运行参数，来实现任务失败自动重试的能力。在 Flink 运行参数中，设置 `studio.restart.attempts=N`参数，即可实现实时任务失败自动重试，其中“N”为自动重试次数，您可按需进行设置。参数配置方式详见“参数设置”中Flink运行参数设置说明。

资源组高级配置完成后，单击配置窗口右上角关闭按钮，退出配置窗口，并检查基本配置所有参数无误后，单击右下角下一步按钮，进行方案的数据缓存配置。

最近更新时间：2025.03.19 19:22:24

这个页面对您有帮助吗？

有用

无用

大数据研发治理套件（私有化）

基本信息 #

网络与资源配置 #

资源组高级配置 #

基本信息

网络与资源配置

资源组高级配置