如何使用Fluentd读取定时更新的data.json文件（不使用tail插件）

如何使用Fluentd读取定时更新的data.json文件（不使用tail插件）

阿华AIGC实验室

2026-5-27

替代tail插件的Fluentd输入方案推荐

嘿，针对你的场景——后台Python服务每120秒生成/覆盖data.json文件，又不能用tail插件，我给你推荐几个实用的Fluentd输入插件方案：

方案1：用`in_exec`定期读取整个文件

这个插件可以按照指定间隔执行命令，刚好匹配你文件120秒更新的频率。我们可以用cat命令直接读取整个JSON文件，再让Fluentd自动解析内容。

配置示例

<source>
  @type exec
  # 替换成你的data.json实际路径
  command cat /opt/app/data.json
  # 自定义标签，方便后续处理日志
  tag json.data
  # 和文件更新频率保持一致的执行间隔
  run_interval 120s
  # 告诉Fluentd把读取到的内容解析为JSON格式
  format json
</source>

注意：如果你的文件是被覆盖式更新（不是追加内容），这个方案非常合适，每次都会读取最新的完整文件内容。

方案2：用`in_fs_event`监听文件修改事件

如果不想固定间隔轮询，而是希望文件一更新就立刻读取，可以用这个插件监听文件系统的修改事件，触发读取操作。

配置示例

<source>
  @type fs_event
  path /opt/app/data.json
  tag json.data
  # 每次触发事件时从文件开头读取完整内容
  read_from_head true
  <event>
    # 监听文件修改事件
    on_modified true
  </event>
  format json
</source>

这个方案更高效，只有当文件确实被修改时才会执行读取，避免了不必要的空轮询。

方案3：修改Python服务，直接推送数据到Fluentd（最推荐）

如果可以调整你的Python代码，跳过生成data.json文件这一步，直接把JSON数据发送给Fluentd，这会是最可靠、低延迟的方案，还能省去文件IO的依赖。

步骤1：配置Fluentd的`in_http`插件

<source>
  @type http
  # 监听的端口，可自定义
  port 8888
  # 允许本地或其他机器访问，根据你的部署调整
  bind 0.0.0.0
  tag json.data
</source>

步骤2：在Python代码中添加推送逻辑

import requests
import json

def send_to_fluentd(data):
    # 替换成你的Fluentd服务地址和端口
    fluentd_endpoint = "http://localhost:8888/json.data"
    headers = {"Content-Type": "application/json"}
    # Fluentd的HTTP输入接受{"json": 你的数据}格式的请求体
    payload = {"json": data}
    try:
        requests.post(fluentd_endpoint, json=payload, headers=headers)
    except Exception as e:
        print(f"推送数据到Fluentd失败: {e}")

# 当你的Python服务生成数据后，直接调用这个函数推送
generated_data = {"Type":"Data", "Name":"XYZ", "Level":32}
send_to_fluentd(generated_data)

这样你的Python服务生成数据后直接推送给Fluentd，完全不需要生成中间文件，流程更顺畅。

内容的提问来源于stack exchange，提问作者S Andrew

火山引擎最新活动

方舟 Coding Plan

模型自由，工具不限，免费解锁 ArkClaw，7*24 小时在线的专属智能伙伴

一键部署 OpenClaw

分钟级部署，云服务器包月低至￥9.9，与 CodingPlan 组合购买仅需19.8元

Seedance2.0 体验中心上线

注册即享免费500万Tokens，抢先领略新一代AI视频技术跃迁

新用户特惠专场

大模型19元起，Al应用9.9元畅享，新人首购爆款尽享优惠