## 一、Topic 介绍Topic(主题)类似于文件系统中的文件夹,事件就是该文件夹中的文件。Kafka 中的主题总是多生产者和多订阅者:一个主题可以有零个、一个或多个向其写入事件的生产者,以及零个、一个或多个订阅这些事件的消费者。可以根据需要随时读取主题中的事件——与传统消息传递系统不同,事件在消费后不会被删除。相反,您可以通过每个主题的配置设置来定义 Kafka 应该保留您的事件多长时间,之后旧事件将被丢弃。Kafka 的性能在...
## 背景新项目涉及大数据方面。之前接触微服务较多,趁公司没反应过来,赶紧查漏补缺。Kafka 是其中之一。Apache Kafka 是一个开源的分布式事件流平台,可跨多台计算机读取、写入、存储和处理事件,并有发布和订阅事件流的特性。本文将研究 Kafka 从生产、存储到消费消息的详细过程。 ## Producer### 消息发送所有的 Kafka 服务器节点任何时间都能响应是否可用、是否 topic 中的 partition leader,这样生产者就能发送它的...
不会持续影响同一块磁盘。且对于回溯访问的磁盘,仅有已经存储在该磁盘的其他 Segment 刚好被用户消费时,或有新的 Segment 要写入该磁盘的时候会受影响。此外我们也可以通过一些策略避免写入有热点访问的磁盘来降低热点访问对新写入的影响。总结来看,Kafka 存储模型下,热点访问对同磁盘其他访问的影响大、持续长、且优化空间不大;而 BMQ 的池化存储模型中, **热点影响范围小、持续时间短,** 并且可以通过一些策略优化进一步降低影...
对此本文将在接下来的内容中以 Kafka 和 RabbitMQ 为例分享消息队列选型的一些经验。消息队列即 Message+Queue,消息可以说是一个数据传输单位,它包含了创建时间、通道/主题信息、输入参数等全部数据;队列(Queue)... 这个时候因为没到时间并不能马上进行处理,也不能保存到内存中,所以就需要将其存入数据库中,等待到时间之后放入 Kafka 中,以便真正的消费者去执行业务逻辑。以上步骤已经接近调度平台了,如果需要再高级一点甚至还需...
Kafka 实例支持自定义设置磁盘清理水位,且每个 Broker 的磁盘清理水位相同。如果实例整体磁盘使用率达到清理水位,或因数据不均衡导致某个 Broker 的磁盘使用率达到清理水位时,无论消息是否超过消息保留时长,都会按服务端存储消息的时间先后顺序删除该节点的部分历史消息,直至磁盘水位恢复,避免磁盘使用率过高导致 Kafka 实例异常,以及避免因节点无法同步数据导致的副本不同步。 说明 触发自动删除策略时,如果消息写入速率超过了磁...
Topic 是火山引擎 Kafka 实例的基础资源。消息生产时写入到 Topic 中,消费时又从消息中读取出来。创建 Topic 时选择合适的参数配置,最大程度上保证实例内部数据和业务流量的均衡,发挥 Kafka 实例的最优能力。 分区... 但相对应的也会占用更多的磁盘存储空间。当前火山引擎 Kafka 实例支持创建副本数为 1 ~ 3 的 Topic。推荐创建 Topic 时使用 3 副本创建,提供最高的可用性与可靠性。若对于可靠性相对要求不高,则可以创建 2 副本的 ...
是否支持多可用区部署 Kafka 实例? 单 AZ 实例如何切换为多 AZ? 变更实例规格或扩容实例会影响业务吗? 如何为实例增加分区? 是否可以删除分区? 为什么不能减少分区? 是否支持缩容? 公网环境必须使用 SASL_SSL 吗? 支持哪些语言的客户端? 支持的消息体最大是多少? 消息的保留时间是多久? 支持的 Kafka 版本包括哪些? 如何选择计算规格和存储规格?消息队列 Kafka版提供多种实例规格供您选择,你可以根据业务的读写流量峰值、所需的...
Upsert Kafka 连接器支持以 upsert 方式从 Kafka topic 中读取数据并将数据写入 Kafka topic,支持做数据源表和结果表。 作为源表时,Upsert Kafka 连接器可以将 Kafka 中存储的数据转换为 changelog 流,其中每条数据记录代表一个更新或删除事件。数据记录中有 key,表示 UPDATE;数据记录中没有 key,表示 INSERT;数据记录中 key 的 value 为空,表示 DELETE。 作为结果表时,Upsert Kafka 连接器可以消费上游计算逻辑产生的 changelog...
请先确定 Kafka 实例可正常访问,以免因访问异常造成迁移失败。您可以访问 Kafka 实例详情页中的接入点,确认实例的网络连通性。 业务迁移之前,请确认您已根据业务需求选择了正确的迁移方案。迁移方案对比请参考概述。 1 环境准备迁移之前,您需要根据业务量合理评估资源需求,并创建 Kafka 实例及相关的依赖资源。 1.1 迁移评估根据现有业务量和消息量估算所需的消息队列 Kafka版资源,例如业务读写流量峰值、磁盘容量和分区数等。不...
请先确定 Kafka 实例可正常访问,以免因访问异常造成迁移失败。您可以访问 Kafka 实例详情页中的接入点,确认实例的网络连通性。 业务迁移之前,请确认您已根据业务需求选择了正确的迁移方案。迁移方案对比请参考概述。 1 环境准备迁移之前,您需要根据业务量合理评估资源需求,并创建 Kafka 实例及相关的依赖资源。 1.1 迁移评估根据现有业务量和消息量估算所需的消息队列 Kafka版资源,例如业务读写流量峰值、磁盘容量和分区数等。不...
前言 Kafka 是一个分布式、支持分区的(partition)、多副本的(replica) 分布式消息系统, 深受开发人员的青睐。 云搜索服务是火山引擎提供的完全托管的在线分布式搜索服务,兼容 Elasticsearch、Kibana 等软件及常用开源插件,为您提供结构化、非结构化文本的多条件检索、统计、报表 在本教程中,您将学习如何使用 Logstash 消费 Kafka 中的数据,并写入到云搜索服务中。 关于实验 预计部署时间:20分钟级别:初级相关产品:消息队列 - Ka...
消息队列 Kafka版支持配置云监控告警规则,帮助您实时关注实例的运行状态。本文档介绍典型场景下的告警规则配置示例,建议参考这些推荐的告警策略,配置监控指标的告警规则。 实例维度 实例磁盘使用容量超过 85%告警规... 扩容实例磁盘。为了避免单个节点磁盘被写满、影响后续的数据写入,建议及时扩容实例磁盘,增加存储空间。操作步骤请参考升级实例规格。 排查业务侧的代码逻辑。调整数据写入方式,确保数据均衡写入到实例的各个节点。...
Kafka 连接器提供从 Kafka Topic 或 BMQ Topic 中消费和写入数据的能力,支持做数据源表和结果表。您可以创建 source 流从 Kafka Topic 中获取数据,作为作业的输入数据;也可以通过 Kafka 结果表将作业输出数据写入到... properties.linger.ms 否 0 string 消息在 Batch 中的停留时间,即发送消息前的等待时长。默认为 0 毫秒,表示“立即发送消息”。 可以适当提升 linger.ms 取值,以引入小延迟为代价,提高吞吐量和压缩率。 该参...