You need to enable JavaScript to run this app.
导航
LogCollector 运维操作失败排查
最近更新时间:2025.08.18 19:06:16首次发布时间:2025.08.18 19:06:16
复制全文
我的收藏
有用
有用
无用
无用

LogCollector 2.3.1及之后版本支持在控制台创建手动升降级、修改配置、重启三种运维操作。
执行对应的运维操作后可能因为某些原因导致操作失败,您可以根据本文档进行排查处理。

排查手动升降级失败

在控制台创建手动升降级操作失败后,可参考如下排查故障,故障排除后,需重新创建手动升降级任务使失败任务中未执行或执行失败的 LogCollector 重新执行升降级。

说明

日志服务提供 LogCollector 安装脚本,支持下载脚本,执行命令升降级 LogCollector,请参考手动升级 LogCollector

查看 LogCollector 部署环境是否为物理机

  • 仅支持对部署在物理机的 LogCollector 在控制台执行手动升降级。
  • 不支持对部署在 Kubernetes 集群的 LogCollector 在控制台执行手动升降级。可通过 LogCollector 安装脚本升级,请参考升级 LogCollector(Kubernetes 集群)

查看网络是否异常导致操作下发超时

  1. 进入/usr/local/logcollector/data/ops/目录。
  2. 查看是否有x.change_version 文件。x为数字序号,表示第x次运维操作文件,例如1.change_version
  3. 如果没有该文件,说明是网络问题导致 LogCollector 和服务点通信受阻,请检查服务器网络。

查看失败日志提示内容

  1. 进入/usr/local/filebeat-7.12.0/data/ops/目录。
  2. 如果存在x.change_version文件,则可以查看对应的x.change_version.fail文件内容,根据文件中的内容提示进行排查。

排查机器组重启失败

查看网络是否异常导致操作下发超时。

  1. 进入/usr/local/logcollector/data/ops/目录。
  2. 查看是否有x.restart文件。x为数字序号,表示第x次运维操作文件,例如1.restart
  3. 如果没有该文件,说明是网络问题导致 LogCollector 和服务点通信受阻,请检查服务器网络。

排查修改配置失败

查看网络是否异常导致操作下发超时。

  1. 进入/usr/local/logcollector/data/ops/目录。
  2. 查看是否有x.modify_config文件。x为数字序号,表示第 x 次运维操作文件,例如1.modify_config
  3. 如果没有该文件,说明是网络问题导致 LogCollector 和服务点通信受阻,请检查服务器网络。

查看修改配置失败日志提示内容

  1. 进入/usr/local/logcollector/data/ops/目录。
  2. 如果存在x.yml文件,则可以查看对应的x.yml.fail文件内容,根据文件中的内容提示进行排查。

    说明

    如果修改配置成功,但是配置项错误导致 LogCollector 启动失败:

    1. 查看/usr/local/logcollector/logs/logcollector-yyyymmdd.log文件中的报错内容。
    2. 根据报错内容,修改x.yml中的配置项。
    3. 在控制台再次修改配置项后,重新下发运维操作。