在AWS S3中，能否通过存储的最后标记获取文件夹新增文件？

阿华AIGC实验室

2026-5-15

能否用存储的S3 Marker获取文件夹新增文件？

完全可行！这其实是S3实现增量文件同步的经典方案之一，不过得先搞清楚marker的工作逻辑，以及正确的使用姿势：

Marker的核心逻辑

你之前代码里存储的marker，本质是上一次遍历结束时最后一个对象的Key。当你把这个marker传入新的ListObjectsRequest时，S3会返回所有键值字典序严格大于该marker的对象——这正好对应你上次遍历之后新增的文件（前提是新增文件的键是按递增顺序生成的，比如时间戳、字母顺序命名）。

你的代码改造示例

基于你原来的代码，只需要在新请求中直接设置存储的marker即可：

// 从存储介质（比如数据库、配置文件）中取出之前保存的marker
String savedMarker = getSavedMarkerFromStorage();

ListObjectsRequest request = new ListObjectsRequest()
    .withBucketName(bucketName)
    .withPrefix("your-target-folder/") // 务必指定文件夹前缀，避免拉取其他目录内容
    .withMarker(savedMarker);

ObjectListing listing = null;
while ((listing == null) || (request.getMarker() != null)) {
    listing = s3Client.listObjects(request);
    // 处理本次拉取到的新增文件
    processNewObjects(listing.getObjectSummaries());
    
    // 更新请求的marker，继续拉取后续分页内容
    request.setMarker(listing.getNextMarker());
}

// 最后记得把本次遍历的最后一个marker重新存储起来，供下次使用
saveMarkerToStorage(listing.getNextMarker());

必须注意的几个细节

键的顺序问题：如果新增的文件键字典序小于你存储的marker（比如手动上传了一个命名更靠前的文件），这些文件会被漏掉。所以尽量保证新增文件的键是递增的（比如用yyyyMMddHHmmss_文件名这种格式）。
删除操作不影响：如果期间有文件被删除，marker机制不会受干扰，返回结果里只会存在当前存在的、键大于marker的对象，不用担心重复或遗漏处理。
API版本建议：ListObjects是S3的旧版API，官方推荐使用ListObjectsV2，对应的参数是ContinuationToken而非Marker，逻辑类似但功能更完善（比如支持更多的分页控制），如果后续升级API要注意参数变化。

总的来说，只要你正确存储和使用marker，这种增量获取的方式非常可靠，是很多S3数据同步场景的标准做法~

内容的提问来源于stack exchange，提问作者N A