## 背景新项目涉及大数据方面。之前接触微服务较多,趁公司没反应过来,赶紧查漏补缺。Kafka 是其中之一。Apache Kafka 是一个开源的分布式事件流平台,可跨多台计算机读取、写入、存储和处理事件,并有发布和订阅事件流的特性。本文将研究 Kafka 从生产、存储到消费消息的详细过程。 ## Producer### 消息发送所有的 Kafka 服务器节点任何时间都能响应是否可用、是否 topic 中的 partition leader,这样生产者就能发送它的...
其中Atlas通过Kafka获取外部系统的元数据变更消息。在开源版本中,每台服务器支持的Kafka Consumer数量有限,在每日百万级消息体量下,经常有长延时等问题,影响用户体验。在2020年底,我们针对Atlas的消息消费部分做... 我们决定投入人力自研一个消息处理框架。当前这个框架很好的支持了字节内部以及ToB场景中Data Catalog对于消息消费和处理的场景。本文会详细介绍框架解决的问题,整体的设计,以及实现中的关键决定。## 需求定义...
## 一、Topic 介绍Topic(主题)类似于文件系统中的文件夹,事件就是该文件夹中的文件。Kafka 中的主题总是多生产者和多订阅者:一个主题可以有零个、一个或多个向其写入事件的生产者,以及零个、一个或多个订阅这些事件的消费者。可以根据需要随时读取主题中的事件——与传统消息传递系统不同,事件在消费后不会被删除。相反,您可以通过每个主题的配置设置来定义 Kafka 应该保留您的事件多长时间,之后旧事件将被丢弃。Kafka 的性能在...
# 问题描述客户想通过外网地址访问 VPC 内的 Kafka 地址进行程序调试,本文展示如果使用iptables转发请求实现外网访问。# 解决方案1.创建一台与 Kafka 同 VPC 的 ECS 服务器,放开安全组 9093 端口同时绑定公网 IP,具体操作参考 [[ECS使用说明]]((https://www.volcengine.com/docs/6396/67793))。2.在部署 Kafka 的机器添加本地解析和修改配置文件如下:* 添加域名解析```undefined# cat /etc/hosts127.0.0.1 localhost...
其中Atlas通过Kafka获取外部系统的元数据变更消息。在开源版本中,每台服务器支持的Kafka Consumer数量有限,在每日百万级消息体量下,经常有长延时等问题,影响用户体验。在2020年底,我们针对Atlas的消息消费部分做... 我们决定投入人力自研一个消息处理框架。当前这个框架很好的支持了字节内部以及ToB场景中Data Catalog对于消息消费和处理的场景。本文会详细介绍框架解决的问题,整体的设计,以及实现中的关键决定。## 需求定义...
1.1 迁移评估根据现有业务量和消息量估算所需的消息队列 Kafka版资源,例如业务读写流量峰值、磁盘容量和分区数等。不同规格的 Kafka 实例代表不同的计算能力及存储空间,请根据业务量合理评估资源需求。 1.2 准备相关资源确认资源需求之后,还需要准备相关资源,例如私有网络和子网、ECS 云服务器和 Kafka 实例。 搭建环境。您需要创建私有网络和子网、购买 ECS 云服务器。迁移后您的服务需要和 Kafka 实例处于相同的区域(Region)和...
1.1 迁移评估根据现有业务量和消息量估算所需的消息队列 Kafka版资源,例如业务读写流量峰值、磁盘容量和分区数等。不同规格的 Kafka 实例代表不同的计算能力及存储空间,请根据业务量合理评估资源需求。 1.2 准备相关资源确认资源需求之后,还需要准备相关资源,例如私有网络和子网、ECS云服务器和 Kafka 实例。 搭建环境。您需要创建私有网络和子网、购买 ECS 云服务器。迁移后您的服务需要和 Kafka 实例处于相同的区域(Region)和...
如果需要通过私有网络访问消息队列 Kafka版实例,请先在相同地域创建 ECS 云服务器、私有网络和子网,且子网中有至少 6 个空闲的内网 IP 地址。创建实例后,不可更改实例所在的私有网络。 如果需要通过公网访问消息队... 支持设置为: LogAppendTime:使用服务端写入消息的时间作为消息时间戳。 CreateTime:使用 Producer 创建消息的时间,也就是客户端传入的消息时间戳(CreateTime)作为消息时间戳。 自动删除Group 是否自动删除 Group...
限制说明Kafka 协议消费功能支持的 Kafka Client 版本为 0.11.x~2.0.x。 Kafka 协议消费功能为开启状态时,您可以消费 Kafka Consumer 运行期间采集到服务端的日志数据。Consumer 首次启动前采集的日志数据不支持消... 2 通过 Kafka 协议消费日志目前日志服务支持通过 Kafka Java SDK 或 Spark、Flink 等框架的 Kafka Connector 插件进行日志数据消费,您可以参考下文配置 Kafka 的基本参数,并参考示例代码消费日志数据。 说明 Ka...
日志服务支持通过 Kafka 协议上传日志数据到服务端,即可以使用 Kafka Producer SDK 来采集日志数据,并通过 Kafka 协议上传到日志服务。本文介绍通过 Kafka 协议将日志上传到日志服务的操作步骤。 背景信息Kafka 作为高吞吐量的消息中间件,在多种自建场景的日志采集方案中被用于消息管道。例如在日志源服务器中的开源采集工具采集日志,或通过 Producer 直接写入日志数据,再通过消费管道供下游应用进行消费。日志服务支持通过 Kafk...
本文档主要介绍 Kafka 使用过程中可能产生 CPU 大量消耗的场景,并针对各个场景提供客户端使用策略相关的优化建议。 背景信息基于产品定位与产品设计,Kafka 并非计算密集型产品,Kafka 实例的业务数据量主要体现在网络带宽占用与磁盘的吞吐,日常场景下无需关注 CPU 占用率。但是在实际生产环境中,往往存在多样化的使用场景,部分业务模型中 CPU 也会成为服务端的使用瓶颈。目前对于服务端 CPU 消耗比较大的主要场景有请求速率过快、...
本文介绍快速上手消息队列 Kafka版的准备工作。 1 准备账号开通服务之前,您需要注册一个火山引擎账号,并完成企业实名认证。对于计费类型为按量计费类型的 Kafka 实例,需要保证账户余额不低于100元才能正常创建和使... 请注意: VPC 和 Kafka 实例必须在同一地域中,跨地域时无法访问。 应配置合理的安全组及相关规则。 子网中有至少 6 个空闲的内网 IP 地址。 3 创建云服务器通过 VPC 访问 Kafka 实例,则必须先购买同一地域的云服务...
本文说明消息队列 Kafka版涉及的专有名词和术语,帮助您更好地理解相关概念并使用该产品。 Apache KafkaApache Kafka 是一款开源的分布式数据流处理平台,可以实时发布、订阅、存储和处理数据流。关于 Apache Kafka 的更多信息,请参见 Apache Kafka。 实例实例,即 Kafka 实例,是一个独立的消息队列 Kafka版资源实体,对应一个 Kafka 集群。 接入点生产者和消费者连接消息队列 Kafka版进行消息收发时,连接服务端使用的地址。 消息消息...