## 背景新项目涉及大数据方面。之前接触微服务较多,趁公司没反应过来,赶紧查漏补缺。Kafka 是其中之一。Apache Kafka 是一个开源的分布式事件流平台,可跨多台计算机读取、写入、存储和处理事件,并有发布和订阅事... 若 leader 在接收记录后,follower 复制数据完成前产生错误,则记录可能丢失acks = all:leader 节点会等待所有同步中的副本确认之后,producer 才能再确认成功。只要至少有一个同步副本存在,记录就不会丢失。这种方...
## 一、Topic 介绍Topic(主题)类似于文件系统中的文件夹,事件就是该文件夹中的文件。Kafka 中的主题总是多生产者和多订阅者:一个主题可以有零个、一个或多个向其写入事件的生产者,以及零个、一个或多个订阅这些事件的消费者。可以根据需要随时读取主题中的事件——与传统消息传递系统不同,事件在消费后不会被删除。相反,您可以通过每个主题的配置设置来定义 Kafka 应该保留您的事件多长时间,之后旧事件将被丢弃。Kafka 的性能在...
数据服务:通过 Kafka、Flume 等消息队列系统,将推荐结果以及其他相关信息以实时或批量形式发布到不同层级和粒度的服务中心,并提供统一且灵活的 API 接口给前端应用。- 数据应用:通过 Echarts、D3.js 等可视化库,将推荐结果以及其他相关信息以图表或地图等形式展示给用户,并根据用户反馈进行优化调整。在这个项目中,我主要使用了以下几种技术:- Python:作为项目开发语言之一,在整个项目中都有广泛使用。Python 具有简...
BMQ 与 Kafka 架构最大的不同在于 BMQ 是 **存算分离的架构** ,相较于 Kafka 将数据存储在本地磁盘,BMQ 将数据存储在了分布式的存储系统。在 BMQ 内部,主要有四个模块:Proxy,Broker,Coordinator 和 Controller。我们依次来看一下这些模块的主要工作:* Proxy 负责接收所有用户的请求,对于生产请求,Proxy 会将其转发给对应的 Broker;对于消费者相关的请求,例如 commit offset,join group 等,Proxy 会将其转发给对应的 Coordin...
Python2 2.7.16 Python3 3.7.3 Java ByteOpenJDK 1.8.0_352 应用程序版本 Hadoop集群 Flink集群 Kafka集群 Presto集群 Trino集群 HBase集群 OpenSearch集群 Doris集群 Pulsar集群 StarRocks集群 Flume 1.9.0 1.9.... hive_server 3.1.3 用于将 Hive 查询作为 Web 请求接受的服务。 hive_client 3.1.3 Hive命令行客户端。 hdfs_namenode 3.3.4 用于跟踪HDFS文件名和数据块的服务。 hdfs_datanode 3.3.4 存储HDFS数据块的节点服务。...
Python2 2.7.16 Python3 3.7.3 Java ByteOpenJDK 1.8.0_352 应用程序版本 Hadoop集群 Flink集群 Kafka集群 Presto集群 Trino集群 HBase集群 OpenSearch集群 Doris集群 Pulsar集群 StarRocks集群 Flume 1.9.0 1.9.... hive_server 3.1.3 用于将 Hive 查询作为 Web 请求接受的服务。 hive_client 3.1.3 Hive命令行客户端。 hdfs_namenode 3.3.4 用于跟踪HDFS文件名和数据块的服务。 hdfs_datanode 3.3.4 存储HDFS数据块的节点服务。...
Python2 2.7.16 Python3 3.7.3 Java ByteOpenJDK 1.8.0_352 应用程序版本 Hadoop集群 Flink集群 Kafka集群 Presto集群 Trino集群 HBase集群 OpenSearch集群 Doris集群 Pulsar集群 StarRocks集群 Flume 1.9.0 1.9.... hive_server 3.1.3 用于将 Hive 查询作为 Web 请求接受的服务。 hive_client 3.1.3 Hive命令行客户端。 hdfs_namenode 3.3.4 用于跟踪HDFS文件名和数据块的服务。 hdfs_datanode 3.3.4 存储HDFS数据块的节点服务。...
Python2 2.7.16 Python3 3.7.3 Java ByteOpenJDK 1.8.0_352 应用程序版本 Hadoop集群 Flink集群 Kafka集群 Presto集群 Trino集群 HBase集群 OpenSearch集群 Doris集群 Pulsar集群 StarRocks集群 Flume 1.9.0 1.9.... hive_server 3.1.3 用于将 Hive 查询作为 Web 请求接受的服务。 hive_client 3.1.3 Hive命令行客户端。 hdfs_namenode 3.3.4 用于跟踪HDFS文件名和数据块的服务。 hdfs_datanode 3.3.4 存储HDFS数据块的节点服务。...
Python2 2.7.16 Python3 3.7.3 Java ByteOpenJDK 1.8.0_352 应用程序版本 Hadoop集群 Flink集群 Kafka集群 Presto集群 Trino集群 HBase集群 OpenSearch集群 Doris集群 Pulsar集群 StarRocks集群 Flume 1.9.0 1.9.... hive_server 3.1.3 用于将 Hive 查询作为 Web 请求接受的服务。 hive_client 3.1.3 Hive命令行客户端。 hdfs_namenode 3.3.4 用于跟踪HDFS文件名和数据块的服务。 hdfs_datanode 3.3.4 存储HDFS数据块的节点服务。...
Python2 2.7.16 Python3 3.7.3 Java ByteOpenJDK 1.8.0_352 应用程序版本 Hadoop集群 Flink集群 Kafka集群 Presto集群 Trino集群 HBase集群 OpenSearch集群 Doris集群 Pulsar集群 StarRocks集群 Flume 1.9.0 1.9.... hive_server 3.1.3 用于将 Hive 查询作为 Web 请求接受的服务。 hive_client 3.1.3 Hive命令行客户端。 hdfs_namenode 3.3.4 用于跟踪HDFS文件名和数据块的服务。 hdfs_datanode 3.3.4 存储HDFS数据块的节点服务。...
Python2 2.7.16 Python3 3.7.3 Java ByteOpenJDK 1.8.0_352 应用程序版本 Hadoop集群 Flink集群 Kafka集群 Presto集群 Trino集群 HBase集群 OpenSearch集群 Doris集群 Pulsar集群 StarRocks集群 Flume 1.9.0 1.9.... hive_server 3.1.3 用于将 Hive 查询作为 Web 请求接受的服务。 hive_client 3.1.3 Hive命令行客户端。 hdfs_namenode 3.3.4 用于跟踪HDFS文件名和数据块的服务。 hdfs_datanode 3.3.4 存储HDFS数据块的节点服务。...
Python2 2.7.16 Python3 3.10.13 Java ByteOpenJDK 1.8.0_352 应用程序版本 Hadoop集群 Flink集群 Kafka集群 HBase集群 StarRocks集群 ClickHouse集群 OpenSearch集群类型 Flume 1.9.0 1.9.0 1.9.0 - - - - OpenL... hive_server 3.1.3 用于将 Hive 查询作为 Web 请求接受的服务。 hive_client 3.1.3 Hive命令行客户端。 hdfs_namenode 3.3.4 用于跟踪HDFS文件名和数据块的服务。 hdfs_datanode 3.3.4 存储HDFS数据块的节点服务。...
Python2 2.7.16 Python3 3.7.3 Java ByteOpenJDK 1.8.0_352 应用程序版本 Hadoop集群 Flink集群 Kafka集群 Presto集群 Trino集群 HBase集群 OpenSearch集群 Doris集群 Pulsar集群 StarRocks集群 Flume 1.9.0 1.9.... hive_server 3.1.3 用于将 Hive 查询作为 Web 请求接受的服务。 hive_client 3.1.3 Hive命令行客户端。 hdfs_namenode 3.3.4 用于跟踪HDFS文件名和数据块的服务。 hdfs_datanode 3.3.4 存储HDFS数据块的节点服务。...