You need to enable JavaScript to run this app.
文档中心
E-MapReduce

E-MapReduce

复制全文
下载 pdf
Airflow
Airflow 日志对接 TOS
复制全文
下载 pdf
Airflow 日志对接 TOS

Airflow 支持配置 S3、GCS、WASB 或 OSS 作为远程日志服务能力,TOS 作为火山引擎提供对象存储方案,也可以通过类似方式接入。本文为您介绍如何将 Airflow 的日志对接存储至 TOS。

注意事项

将 Airflow 的日志对接存储至 TOS 时,您需要保障 Airflow 与对应 TOS 间的网络是联通状态。

Airflow 侧配置:创建 Connection
  1. 使用 admin 账号登录 Airflow,在顶部导航的 Admin 菜单下拉中单击 connections,新建 Connection,在新建 Connection 页面中配置必要的参数。
    Image
    其中核心参数如下。

    参数

    配置说明

    AWS Access Key ID & AWS Secret Access Key

    配置为火山引擎账号的 AK、SK信息,获取 AK、SK的操作详情请参见Access Key(密钥)管理

    Extra

    在 Extra 中参考以下格式,配置其他 TOS 连接参数。

    {
      "region_name": "cn-beijing",
      "endpoint_url": "https://tos-s3-cn-beijing.ivolces.com",
      "config_kwargs": {
        "signature_version": "s3v4",
        "s3": {
          "addressing_style": "virtual"
        }
      }
    }
    

    其中:

    • region_name 及 endpiont_url :按照实际填写,
    • addressing_style:配置为“virtual”,Airflow 对接 TOS 时默认使用 virtual host style。
  2. 创建完成后,您可以在 List Connection 页面中看到本次新增的 Connection,记录其中的“Conn id”的取值,用于后续管理侧的配置。
    Image

EMR管控侧配置:修改服务参数
  1. 登录 EMR on ECS 控制台,在对应集群的 Airflow 服务的服务参数中,通过搜索“remote”关键词,查找并配置远程日志相关参数。
    Image
    • remote_log_conn_id:配置为上述步骤中在 Airflow 中添加的 Connection 的“Conn id”的取值。
    • remote_base_log_folder:根据实际业务规划,配置为后续日志文件在 TOS 中的默认存放目录。
    • remote_logging:配置为“True”,开启Airflow 的 remote log 功能。
  2. 修改后完成,重启 Airflow 组件,使配置生效。

服务功能验证
  1. 您可通过一个测试 DAG,验证 Airflow 的日志是否可正常存储至 TOS 的 Bucket 中。以下是一个简单的测试 DAG 示例。

    from airflow.decorators import dag
    from airflow.operators.bash import BashOperator
    import pendulum
    @dag(
        dag_id='tos_remote_log_dag',
        start_date=pendulum.datetime(2023, 1, 1, tz="UTC"),
        catchup=False,
        schedule=None,
        tags=['debug'],
    )
    def tos_remote_dag():
        BashOperator(
            task_id='simple_bash_task',
            bash_command='echo "Hello Tos!"',
        )
    tos_remote_dag()
    
  2. 在 Airflow 中查看对应的 Log 信息。
    Image

  3. 在 TOS 控制台查看对应的 DAG 是否已经将运行日志写入配置的 Bucket 中。
    Image

最近更新时间:2026.05.11 14:43:52
这个页面对您有帮助吗?
有用
有用
无用
无用