KafkaConnect.OffsetStorageReader在第一次调用poll()时抛出异常，但在下一次调用poll()时可以获取到sourceOffset，不会出现异常

这个问题是由于在 OffsetStorageReader 创建时没有调用恰当的方法或配置所导致的。可以通过在创建 OffsetStorageReader 时添加以下代码解决问题：

Map<String, String> offsetConfig = new HashMap<>(); offsetConfig.put("bootstrap.servers", "localhost:9092"); offsetConfig.put("group.id", "test-group"); offsetConfig.put("key.deserializer", StringDeserializer.class.getName()); offsetConfig.put("value.deserializer", StringDeserializer.class.getName()); offsetConfig.put("auto.offset.reset", "earliest");

KafkaConsumer<String, String> kafkaConsumer = new KafkaConsumer<>(offsetConfig); kafkaConsumer.subscribe(Arrays.asList("test-topic"));

// 为 OffsetStorageReader 添加以下代码 OffsetStorageReader offsetStorageReader = new KafkaOffsetStorageReader(kafkaConsumer);

// 确保在创建 OffsetStorageReader 之后调用 poll() 方法 try { while (true) { Map<String, Object> sourcePartition = new HashMap<>(); sourcePartition.put("topic", "test-topic"); Map<String, Object> sourceOffset = offsetStorageReader.offset(sourcePartition);

    // 在 OffsetStorageReader 调用 poll() 方法之前需要调用 setStartOffsets 方法
    kafkaConsumer.assignment().forEach(topicPartition -> {
        sourcePartition.put("partition", topicPartition.partition());
        offsetStorageReader.setStartOffsets(Collections.singletonMap(sourcePartition, topicPartition.offset()));
    });

    // 调用 poll() 方法
    ConsumerRecords<String, String> records = kafkaConsumer.poll(Duration.ofMillis(100));

    // 处理数据记录...
}

} catch (Exception e) { e.printStackTrace(); } finally { kafkaConsumer.close(); }

使用 setStartOffsets() 方法和正确的参数为 OffsetStorageReader 指定正确的初始偏移量来解决这个问题。

本文内容通过AI工具匹配关键字智能整合而成，仅供参考，火山引擎不对内容的真实、准确或完整作任何形式的承诺。如有任何问题或意见，您可以通过联系service@volcengine.com进行反馈，火山引擎收到您的反馈后将及时答复和处理。

展开更多

开发者特惠

面向开发者的云福利中心，ECS 60元/年，域名1元起，助力开发者快速在云上构建可靠应用

ECS首年60元

社区干货

Kafka 消息传递详细研究及代码实现|社区征文

发送了一条/批消息之后,需要什么条件或者需要等待多久才能发送下一条消息呢,发送失败会重试吗?......Kafka Documentation 中 *[Producer Configs](https://kafka.apache.org/documentation/#producerconfigs)* ... 直到找到 offset 为 345682 的数据 ### 接收消息Kafka consumer 从 broker 中 pull 数据。具体代码实现调用 poll() 方法。```// poll() 调用间隔时间ConsumerRecords records = consumer.poll(Duration...

聊聊 Kafka:Topic 创建流程与源码分析 | 社区征文

一个或多个订阅这些事件的消费者。可以根据需要随时读取主题中的事件——与传统消息传递系统不同,事件在消费后不会被删除。相反,您可以通过每个主题的配置设置来定义 Kafka 应该保留您的事件多长时间,之后旧事件将... 不是的话则抛出异常;CreateTopic 操作必须由 Controller 来进行,因为有可能客户端发起请求的时候 Controller 已经变更。- kafka 相关鉴权- 最后调用 adminManager.createTopics()#### 3.6.3 adminManager....

火山引擎ByteHouse基于云原生架构的实时导入探索与实践

在分享中,火山引擎ByteHouse技术专家以Kafka和物化MySQL两种实时导入技术为例,介绍了ByteHouse的整体架构演进以及基于不同架构的实时导入技术实现。# 架构整体的演进过程## 分布式架构概述ByteHouse是基于社... 其本身是一个分布式数据库,加之其底层设计和实现让它在性能方面非常优秀,具体表现为单机可以达到每秒上亿行的读取速度以及GiB级的数据吞吐。由于社区官方不会做云服务的限制,所以社区开源的只是分布式架构。社区...

火山引擎上云迁移指南(二):迁移实施

火山引擎对象存储TOS(Tinder Object Storage)是火山引擎提供的海量、安全、低成本、易用、高可靠、高可用的分布式云存储服务。您可以通过RESTful API接口、SDK和工具等多种形式使用火山引擎TOS。通过网络,您可以在... 支持日志服务历史归档数据和实时数据的迁移 - TLS的数据恢复支持指定时间点的数据### 消息队列:Kafka > 您也可以参考[Kafka业务迁移](https://www.volcengine.com/docs/6439/120440),将自建 Kafka 集群或其他...

特惠活动

域名注册服务

cn/top/com等热门域名，首年低至1元，邮箱建站必选

￥1.00/首年起32.00/首年起

立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗，加速分发更实惠

￥2.00/年20.00/年

立即购买

KafkaConnect.OffsetStorageReader在第一次调用poll()时抛出异常，但在下一次调用poll()时可以获取到sourceOffset，不会出现异常 -优选内容

Kafka 消息传递详细研究及代码实现|社区征文

Kafka 消费者最佳实践

本文档以 Confluent 官方 Java 版本客户端 SDK 为例,介绍使用火山引擎 Kafka 实例时的消费者最佳实践。广播与单播在同一个消费组内部,每个消息都预期仅仅只被消费组内的某个消费者消费一次,因而使用同一个消费组的... 需要保证拉取的线程不会异常退出或者被阻塞,否则会导致无法正常发起消费请求。消费者的所有请求发送和响应几乎都基于消费者poll方法的调用。若客户端使用订阅(Subscribe)的方式进行消费,那么在使用过程中,需要保证...

Kafka订阅埋点数据(私有化)

代码示例: Plain public static void main() { Properties properties = new Properties(); // broker list获取方式: sd config kafka_vpc properties.put("bootstrap.servers", "127.0.0.1:9092"); properties.put("group.id", "test_group"); properties.put("auto.offset.reset", "earliest"); properties.put("key.deserializer", "org.apache.kafka.common.serialization.ByteArrayDeserializer"); pr...

Kafka订阅埋点数据(私有化)

KafkaConnect.OffsetStorageReader在第一次调用poll()时抛出异常，但在下一次调用poll()时可以获取到sourceOffset，不会出现异常 -相关内容

聊聊 Kafka:Topic 创建流程与源码分析 | 社区征文

火山引擎ByteHouse基于云原生架构的实时导入探索与实践

火山引擎上云迁移指南(二):迁移实施

域名注册服务

cn/top/com等热门域名，首年低至1元，邮箱建站必选

￥1.00/首年起32.00/首年起

立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗，加速分发更实惠

￥2.00/年20.00/年

立即购买

数据库顶会 VLDB 2023 论文解读 - Krypton: 字节跳动实时服务分析 SQL 引擎设

数据通过 Kafka 流入不同的系统。对于离线链路,数据通常流入到 Spark/Hive 中进行计算,结果通过 ETL 导入到 HBase/ES/ClickHouse 等系统提供在线的查询服务。对于实时链路, 数据会直接进入到 HBase/ES 提供高并发低... Krypton 在 Data Server 内部实现了一个多级 Cache,可以使用 DRAM、PMEM 和 SSD 来作为 Cache 的存储介质。如下图所示,Cache 模块包含了三个部分:Cache Index、Replacement Policy 和 Cache Storage Engine。![...

干货丨字节跳动基于 Apache Hudi 的湖仓一体方案及应用实践

Hudi 作为数据湖框架的一种开源实现,其核心特性能够满足对于实时/离线存储层统一的诉求:**●**支持实时消费增量数据:**提供 Streaming Source/Sink 能力**,数据分钟级可见可查; **●**支持离线批量更新数据:保... 为了方便大家进一步的理解,图中涉及到的各部分含义如下: **●** Table:对应一张 Hudi 表; **●** Partition:可以按照指定字段进行分区,对应的是一个 Storage 的目录(类似 Hive 分区的概念); **●** FileGro...

火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0(中)

**服务层主要包括如下组件:**- **资源管理器**资源管理器(Resource Manager)负责对计算资源进行统一的管理和调度,能够收集各个计算组的性能数据,为查询、写入和后台任务动态分配资源。同时支持计算资源隔离和... 数据表的数据文件存储在远端的统一分布式存储系统中,与计算节点分离开来。底层存储系统可能会对应不同类型的分布式系统。例如 HDFS,Amazon S3, Google cloud storage,Azure blob storage,阿里云对象存储等等。 ...

通过 Kafka 协议消费日志

2 通过 Kafka 协议消费日志目前日志服务支持通过 Kafka Java SDK 或 Spark、Flink 等框架的 Kafka Connector 插件进行日志数据消费,您可以参考下文配置 Kafka 的基本参数,并参考示例代码消费日志数据。说明 Ka... 您也可以在日志服务控制台的 Topic 详情页中查看并复制 Kafka 协议消费主题 ID。错误信息使用 Kafka 协议上传日志失败时,会按照 Kafka 的错误码返回对应的错误信息,请参考 Kafka error list获取更多信息。除此之...

数据库顶会 VLDB 2023 论文解读:Krypton: 字节跳动实时服务分析 SQL 引擎设计

开发指南

KafkaProducer<>(properties);try { for (int i = 0; i (topic, value + i++)) .get(5, TimeUnit.SECONDS); logger.info("recordMetadata topic={}, partition={}, offset={}, count = {... records = consumer.poll(Duration.ofMillis(500)); for (ConsumerRecord record : records) { logger.info("consumed record, topic={}, partition={}, offset={}, key={}, value={}", ...

特惠活动

域名注册服务

cn/top/com等热门域名，首年低至1元，邮箱建站必选

￥1.00/首年起32.00/首年起

立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗，加速分发更实惠

￥2.00/年20.00/年

立即购买

KafkaConnect.OffsetStorageReader在第一次调用poll()时抛出异常，但在下一次调用poll()时可以获取到sourceOffset，不会出现异常

开发者特惠

社区干货

Kafka 消息传递详细研究及代码实现|社区征文

聊聊 Kafka:Topic 创建流程与源码分析 | 社区征文

火山引擎ByteHouse基于云原生架构的实时导入探索与实践

火山引擎上云迁移指南(二):迁移实施

特惠活动

热门爆款云服务器

域名注册服务

DCDN国内流量包100G

KafkaConnect.OffsetStorageReader在第一次调用poll()时抛出异常，但在下一次调用poll()时可以获取到sourceOffset，不会出现异常 -优选内容

KafkaConnect.OffsetStorageReader在第一次调用poll()时抛出异常，但在下一次调用poll()时可以获取到sourceOffset，不会出现异常 -相关内容

聊聊 Kafka:Topic 创建流程与源码分析 | 社区征文

火山引擎ByteHouse基于云原生架构的实时导入探索与实践

火山引擎上云迁移指南(二):迁移实施

热门爆款云服务器

域名注册服务

DCDN国内流量包100G

数据库顶会 VLDB 2023 论文解读 - Krypton: 字节跳动实时服务分析 SQL 引擎设

干货丨字节跳动基于 Apache Hudi 的湖仓一体方案及应用实践

火山引擎云原生数据仓库 ByteHouse 技术白皮书 V1.0(中)

通过 Kafka 协议消费日志

数据库顶会 VLDB 2023 论文解读:Krypton: 字节跳动实时服务分析 SQL 引擎设计

开发指南

特惠活动

热门爆款云服务器

域名注册服务

DCDN国内流量包100G

产品体验

体验中心

云服务器特惠

白皮书

相关主题

最新活动

爆款1核2G共享型服务器

火山引擎增长体验专区

数据智能VeDI

热门访问

一键开启云上增长新空间