## 一、Topic 介绍Topic(主题)类似于文件系统中的文件夹,事件就是该文件夹中的文件。Kafka 中的主题总是多生产者和多订阅者:一个主题可以有零个、一个或多个向其写入事件的生产者,以及零个、一个或多个订阅这些事... ## 二、Topic 的创建方式### 2.1 zookeeper 方式(不推荐)```./bin/kafka-topics.sh --create --zookeeper localhost:2181 --partitions 3 --replication-factor 3 --topic topic_test```注:-–zookeeper 后...
在面对众多的消息队列时,我们往往会陷入选择的困境:“消息队列那么多,该怎么选啊?Kafka 和 RabbitMQ 比较好用,用哪个更好呢?”想必大家也曾有过类似的疑问。对此本文将在接下来的内容中以 Kafka 和 RabbitMQ 为例分... 稳定的和安全的企业级消息通信。不过由于历史原因包袱太重,目前市场份额没有后面三种消息中间件多,其最新架构被命名为 Apollo,号称下一代 ActiveMQ,有兴趣的同学可自行了解。* **RabbitMQ** 是采用 Erlang 语言实...
文 | **洪剑**、**大滨** 来自字节跳动数据平台开发套件团队# 背景## 动机字节数据中台DataLeap的Data Catalog系统基于Apache Atlas搭建,其中Atlas通过Kafka获取外部系统的元数据变更消息。在开源版本中,每台... 封装 | 确保不丢消息的前提下,依赖框架做Offset的提交,业务侧只需要编写消息的处理逻辑;另外,将系统状态以Metric方式暴露 || 轻量 | 支持与后端服务混合部署,不引入额外的维护成本## 相关工作...
其中Atlas通过Kafka获取外部系统的元数据变更消息。在开源版本中,每台服务器支持的Kafka Consumer数量有限,在每日百万级消息体量下,经常有长延时等问题,影响用户体验。在2020年底,我们针对Atlas的消息消费部分做... 封装 | 确保不丢消息的前提下,依赖框架做Offset的提交,业务侧只需要编写消息的处理逻辑;另外,将系统状态以Metric方式暴露 || 轻量 | 支持与后端服务混合部署,不引入额外的维护成本 ...
1. 功能概述 VeCDP产品提供强大的开放能力,支持通过内置Kafka对外输出的VeCDP系统内的数据资产。用户可以通过监测Kafka消息,及时了解标签、分群等数据变更,赋能更多企业业务系统。 2. 消息订阅配置说明 topic规范cdp的kafka topic是按集团拆分的,topic格式如下: json cdp_dataAsset_orgId_${org_id}截止到1.21,如果想使用cdp的消息总线消费事件,cdp只会建一个默认的集团topic cdp_dataAsset_orgId_1。如果默认集团id不为1,或者新...
文 | **洪剑**、**大滨** 来自字节跳动数据平台开发套件团队# 背景## 动机字节数据中台DataLeap的Data Catalog系统基于Apache Atlas搭建,其中Atlas通过Kafka获取外部系统的元数据变更消息。在开源版本中,每台... 封装 | 确保不丢消息的前提下,依赖框架做Offset的提交,业务侧只需要编写消息的处理逻辑;另外,将系统状态以Metric方式暴露 || 轻量 | 支持与后端服务混合部署,不引入额外的维护成本## 相关工作...
日志服务提供 Kafka 协议消费功能,即可以将一个日志主题,当作一个 Kafka Topic 来消费。本文档介绍通过 Kafka 协议消费日志数据的相关步骤。 背景信息日志服务支持为指定的日志主题开启 Kafka 协议消费功能,开启后... 日志服务还在 Java 语言 Kafka 错误码 SASLAuthenticationException 中封装了鉴权、配置相关参数的错误信息,详细说明如下: 错误信息 说明 invalid SASL/PLAIN request: expected 3 tokens 未配置 user 或者pass...
本文介绍通过 SASL_SSL 接入点连接 Kafka 实例,进行消息生产和消息消费的操作步骤。 背景信息消息队列 Kafka版通过 SASL_SSL 接入点提供多重安全保障的访问方式,选择该接入点连接实例时,数据需要通过 SASL_PLAIN 协... Topic 名称 Kafka 实例的 Topic 名称。 输入需要生产的消息内容,按回车键发送此消息到 Kafka 实例。 光标下输入的每一行内容都将封装到消息中发送到 Kafka 实例。如需停止生产,可以使用 Ctrl+C 命令退出消息生...
本文介绍通过 SASL_PLAINTEXT 接入点连接 Kafka 实例,进行消息生产和消息消费的操作步骤。 背景信息消息队列 Kafka版提供 SASL/PLAIN 协议的安全访问方式,即 SASL_PLAINTEXT 接入点。通过 SASL_PLAINTEXT 接入点连... Topic名称 Kafka 实例的 Topic 名称。 输入需要生产的消息内容,按回车键发送此消息到 Kafka 实例。光标下输入的每一行内容都将封装到消息中发送到 Kafka 实例。如需停止生产,可以使用 Ctrl+C 命令退出消息生产...
其中Atlas通过Kafka获取外部系统的元数据变更消息。在开源版本中,每台服务器支持的Kafka Consumer数量有限,在每日百万级消息体量下,经常有长延时等问题,影响用户体验。在2020年底,我们针对Atlas的消息消费部分做... 封装 | 确保不丢消息的前提下,依赖框架做Offset的提交,业务侧只需要编写消息的处理逻辑;另外,将系统状态以Metric方式暴露 || 轻量 | 支持与后端服务混合部署,不引入额外的维护成本 ...
可以帮助企业更好地实现数据智能化决策。近期,火山引擎ByteHouse技术专家受邀参加DataFunCon2023(深圳站)活动,并以“火山引擎ByteHouse基于云原生架构的实时导入探索与实践”为题进行了技术分享。在分享中,火山引擎ByteHouse技术专家以Kafka和物化MySQL两种实时导入技术为例,介绍了ByteHouse的整体架构演进以及基于不同架构的实时导入技术实现。# 架构整体的演进过程## 分布式架构概述ByteHouse是基于社区ClickHouse数据...
各种不同体型的企业都喜欢选择开源大数据软件来搭建自己的系统,无论是先前十分繁荣的 Hadoop,还是后来涌现出来的 Kafka、Flink 等,都被广泛地使用着。十多年来,这些系统经历了多轮技术洗礼,我们也随之需要根据新... 降本增效是每家企业应该考虑的问题。-----------------提升服务器资源利用率,对于拥有大量机器资源的公司来说无疑是一个很重要的问题,也是企业研发实力的一种体现。有种说法是业界的资源利用率一般是20%,但谷...
其中Atlas通过Kafka获取外部系统的元数据变更消息。在开源版本中,每台服务器支持的Kafka Consumer数量有限,在每日百万级消息体量下,经常有长延时等问题,影响用户体验。在2020年底,我们针对Atlas的消息消费部分做... 重试次数可定义 || 并行与顺序处理 | Partition内部支持按照某个Key重新分组,不同Key之间接受并行,同一个Key要求顺序处理 || 消息处理时间 | 不同类型的消息,处理时间会有较大差别,从<1s~1min || 封装 | 确保不...