Docker环境下FastAPI应用启动时transformers导入报错：'NoneType' object has no attribute 'split'

阿华AIGC实验室

2026-3-31

看起来你遇到的是transformers库在导入阶段解析环境变量时，某个变量为None却被调用了split()方法导致的启动崩溃。结合你的环境信息和已做的排查，我整理了几个高概率的根因和对应的解决办法：

一、先检查环境变量的设置时机

你提到在Python脚本里添加了环境变量，但如果这些设置代码的位置晚于sentence_transformers/transformers的导入语句，那等于白做！

举个反例：如果你的api_server.py是这样写的：

# 先导入触发transformers加载的模块
from modules.rag.graph import RAGPipeline

# 再设置环境变量
import os
os.environ["TRANSFORMERS_NO_TF"] = "1"

这种情况下，环境变量设置在导入之后，完全不会影响transformers的导入逻辑。

正确做法：
把环境变量设置代码放在脚本的最开头，甚至在任何其他导入之前：

import os
# 强制设置所有关键环境变量
os.environ["TRANSFORMERS_NO_TF"] = "1"
os.environ["TF_USE_LEGACY_KERAS"] = "1"
os.environ["CUDA_VISIBLE_DEVICES"] = "-1"
os.environ["HF_HOME"] = "/tmp/hf_cache"  # 显式指定容器内可写的缓存目录
os.environ["TRANSFORMERS_CACHE"] = "/tmp/hf_cache"

# 再进行其他导入
from fastapi import FastAPI
# ... 后续的导入和代码

二、定位触发split()错误的具体环境变量

Transformers v4.39.3中，以下几个环境变量的处理逻辑会用到split()，如果它们的值为None，就会触发这个报错：

CUDA_VISIBLE_DEVICES：虽然你设置了-1，但要确认在Docker容器中这个变量是否真的生效。
- 验证方法：在容器内执行echo $CUDA_VISIBLE_DEVICES，或者在Python脚本开头打印变量值：print("CUDA_VISIBLE_DEVICES:", os.environ.get("CUDA_VISIBLE_DEVICES"))
HF_HOME/TRANSFORMERS_CACHE：如果这两个变量未被显式设置，transformers会尝试使用系统默认路径，但在Docker环境下可能因权限或路径问题导致变量被解析为None。
TRANSFORMERS_PIPELINE_REQUIREMENTS_INSTALL：这个变量控制依赖安装逻辑，虽然概率较低，但如果被设为None也可能触发异常。

快速排查脚本：
在Python代码最顶部添加以下内容，启动容器后查看输出，找到值为None的变量：

import os
# 打印所有可能相关的环境变量
check_vars = [
    "CUDA_VISIBLE_DEVICES", "TRANSFORMERS_CACHE", "HF_HOME",
    "TRANSFORMERS_NO_TF", "TF_USE_LEGACY_KERAS"
]
for var in check_vars:
    print(f"{var}: {os.environ.get(var)}")

三、Docker环境专属的额外排查点

容器内的文件权限：如果你的应用以非root用户运行，要确保HF_HOME/TRANSFORMERS_CACHE指向的目录有读写权限。
- 解决办法：在Dockerfile中提前创建目录并赋予权限：
```
# 假设你的应用用户是appuser
RUN mkdir -p /tmp/hf_cache && chown -R appuser:appuser /tmp/hf_cache
ENV HF_HOME=/tmp/hf_cache
ENV TRANSFORMERS_CACHE=/tmp/hf_cache
```
隐式的依赖冲突：虽然你卸载了standalone Keras，但要确认是否有其他依赖间接安装了它。执行pip list | grep keras，确保只有tf-keras出现在列表中。
离线环境的特殊处理：如果容器处于离线环境，记得添加ENV TRANSFORMERS_OFFLINE=1，避免transformers尝试连接Hugging Face Hub引发额外异常。

四、极端情况：强制绕开TensorFlow依赖

如果TRANSFORMERS_NO_TF=1没有生效，可能是transformers版本的小bug，可以尝试在导入sentence_transformers前，直接强制切换到PyTorch后端：

import os
os.environ["TRANSFORMERS_NO_TF"] = "1"
os.environ["TRANSFORMERS_PREFER_TORCH"] = "1"

# 先初始化transformers的后端设置
from transformers import utils
utils.set_transformers_prefer_torch()

# 再导入sentence_transformers模块
from sentence_transformers import CrossEncoder