.NET 9中使用Semantic Kernel调用Ollama qwen3-vl多模态模型处理图片时超时的问题求助

阿华AIGC实验室

2026-4-1

看起来你遇到的这个超时问题确实挺棘手——文本处理一切正常，一涉及图片就卡壳到超时，哪怕调大超时时间也没用，肯定很闹心。我结合你的描述、代码片段和环境信息，梳理了几个优先级较高的排查方向，你可以逐一试试：

1. 先确认Ollama服务端本身能否正常处理图片请求

这是最基础的排查步骤，先排除模型服务端的问题：

直接用Ollama CLI测试：打开命令行，输入ollama run qwen3-vl，然后粘贴你的工具返回的Base64图片字符串（格式是data:image/jpeg;base64,xxxxxx），问模型“这张图片里有什么？”，看看模型能不能正常返回结果，会不会卡在服务端。
查看Ollama日志：Windows上可以通过ollama logs命令查看实时日志，或者去C:\Users\<你的用户名>\.ollama\logs目录找日志文件，看看处理图片请求时有没有报错、内存占用过高、进程无响应的情况。如果Ollama本身处理图片就卡，那调客户端超时肯定没用。

2. 检查Semantic Kernel的超时配置是否真正生效

你说已经增加了超时，但要确认配置的位置是否正确——Semantic Kernel的超时不是只在OpenAIPromptExecutionSettings里设置就行的：

客户端级别超时：注册Ollama/OpenAI兼容服务时，要给HttpClient设置超时，这是最底层的超时限制：

var kernelBuilder = Kernel.CreateBuilder();
// 用AddOllamaChatCompletion的情况
kernelBuilder.AddOllamaChatCompletion(
    modelId: "qwen3-vl",
    endpoint: new Uri("http://localhost:11434"),
    httpClient: new HttpClient
    {
        Timeout = TimeSpan.FromMinutes(5) // 这里设置全局客户端超时
    });
// 用AddOpenAIChatCompletion的情况（兼容Ollama的v1接口）
kernelBuilder.AddOpenAIChatCompletion(
    modelId: "qwen3-vl",
    apiKey: "ollama", // Ollama不需要真实密钥，随便填
    endpoint: new Uri("http://localhost:11434/v1"),
    httpClient: new HttpClient
    {
        Timeout = TimeSpan.FromMinutes(5)
    });

Agent/执行设置的超时：确保OpenAIPromptExecutionSettings的Timeout也同步设置，并且AgentGroupChat没有额外的超时限制：

OpenAIPromptExecutionSettings settings = new()
{
    FunctionChoiceBehavior = FunctionChoiceBehavior.Auto(),
    MaxTokens = 1000,
    Temperature = 0.0,
    Timeout = TimeSpan.FromMinutes(5) // 同步设置提示级别的超时
};

3. 排查图片数据的传递格式与模型兼容性

qwen3-vl对多模态输入的格式可能有特定要求，你可以检查这几点：

确认工具返回的data:image/jpeg;base64,xxxx格式是否被模型正确识别。有些多模态模型可能需要更明确的提示，比如在Agent的Instructions里补充：

Instructions = @"你是一个乐于助人的助手。当你收到以`data:image/jpeg;base64,`开头的字符串时，这是图片的Base64编码内容，请直接基于该内容分析图片。"

验证Base64图片的有效性：把你的工具返回的Base64字符串复制到浏览器地址栏，看看能不能正常显示图片，避免压缩过程中损坏了图片数据（比如你的CompressImageToBase64方法用了System.Drawing，注意GDI+的图片处理可能有隐性格式转换错误）。

4. 简化测试场景，定位问题范围

把复杂的Agent逻辑去掉，直接测试模型的图片处理能力，缩小问题范围：

跳过Agent，直接调用ChatCompletionService：

// 测试用代码，直接传递Base64图片给模型
var chatHistory = new ChatHistory();
chatHistory.AddUserMessage("What's in this picture?");
chatHistory.AddUserMessage("Here's the image: 你的Base64字符串");

var response = await _chatCompletionService.GetChatMessageContentAsync(chatHistory, settings);
Console.WriteLine(response.Content);

如果这个测试能正常返回结果，说明问题出在AgentGroupChat的逻辑里（比如Agent处理工具返回结果后的思考流程卡住）；如果还是超时，那问题就在模型服务端或者Semantic Kernel的连接器层面。

5. 资源与模型配置优化

qwen3-vl处理图片需要较多资源，资源不足可能导致服务假死：

检查系统资源：当模型处理图片时，打开任务管理器看内存、CPU占用，如果内存占满，Ollama服务会无响应。可以在Ollama的配置文件C:\Users\<你的用户名>\.ollama\config.json里调整资源限制：
```
{
  "num_ctx": 8192, // 上下文窗口大小，按需调整
  "num_thread": 8, // 对应你的CPU核心数，比如8核就设8
  "num_gpu": 0 // 没有N卡的话设0，有卡的话可以设为1启用GPU加速
}
```
尝试更小的图片：把压缩后的图片尺寸再调小（比如128x128），生成更短的Base64字符串，看看模型能不能快速处理，排除图片数据量过大导致的过载。

6. 检查Semantic Kernel包版本的一致性

你提到的包版本里有笔误（比如Microsoft.SemanticKernel v1.66应该是1.6.6），确保所有相关包的版本完全一致，避免版本不匹配导致的隐性问题：

<PackageReference Include="Microsoft.SemanticKernel" Version="1.6.6" />
<PackageReference Include="Microsoft.SemanticKernel.Connectors.Ollama" Version="1.6.6" />
<PackageReference Include="Microsoft.SemanticKernel.Agents.Core" Version="1.6.6" />

先从这几个方向排查，尤其是第一步的Ollama CLI测试，能最快定位是服务端还是客户端的问题。如果有新的测试结果或者报错信息，随时补充，我再帮你进一步分析！

另外，附上你提供的关键代码片段方便参考（已格式化）：

OpenAIChatExample.cs 核心代码

internal class OpenAIChatExample : IOllamaChatExample
{
    private readonly ILoggerFactory _logger;
    private readonly IChatCompletionService _chatCompletionService;
    private readonly IConfigurationRoot _configuration;
    private readonly Kernel _kernel;

    public OpenAIChatExample(Kernel kernel, ILoggerFactory logger, IConfigurationRoot configuration)
    {
        _configuration = configuration;
        _kernel = kernel;
        _logger = logger;
        _chatCompletionService = _kernel.GetRequiredService<IChatCompletionService>();
    }

    public async void Start()
    {
        OpenAIPromptExecutionSettings settings = new()
        {
            FunctionChoiceBehavior = FunctionChoiceBehavior.Auto(),
            MaxTokens = 1000,
            Temperature = 0.0
        };

        ChatCompletionAgent completionAgent = new()
        {
            Instructions = @"You are a helpful Assistant",
            Name = "AI Completion Assistant",
            Kernel = _kernel,
            Arguments = new(settings),
        };

        KernelPlugin fileContentsPlugin = KernelPluginFactory.CreateFromType<FileContentsPlugin>();
        completionAgent.Kernel.Plugins.Add(fileContentsPlugin);

        AgentGroupChat chat = new();
        chat.AddAgent(completionAgent);
        chat.AddChatMessage(new ChatMessageContent(AuthorRole.User, "What's in this picture? \"C:\\Temp\\Picture 1-1.png\""));

        await foreach (ChatMessageContent content in chat.InvokeAsync())
        {
            Console.WriteLine(content.Content);
        }
    }
}

FileContentsPlugin.cs 核心代码

public class FileContentsPlugin
{
    [KernelFunction, Description("Gets the contents of an image, in base64 format")]
    [return: Description("Image file contents details")]
    public async Task<string> ImageFileSearchAsync([Description("file path")] string filePath)
    {
        try
        {
            if (!File.Exists(filePath))
            {
                return $"The file at path '{filePath}' does not exist.";
            }
            byte[] imageBytes = System.IO.File.ReadAllBytes(filePath);
            string base64String = Utility.CompressImageToBase64(filePath);
            string data = $"data:image/jpeg;base64,{base64String}";
            return data;
        }
        catch (Exception ex)
        {
            return $"An error occurred while accessing the file: {ex.Message}";
        }
    }
}

Utility.cs 核心代码

public static class Utility
{
    public static string CompressImageToBase64(string path, int maxSize = 256)
    {
        using var img = System.Drawing.Image.FromFile(path);
        var resized = new Bitmap(img, new Size(maxSize, maxSize));
        using var ms = new MemoryStream();
        resized.Save(ms, ImageFormat.Jpeg);
        return Convert.ToBase64String(ms.ToArray());
    }
}