You need to enable JavaScript to run this app.
优惠活动
大模型
产品
解决方案
定价
更多
文档控制台
免费开始使用

如何修复Azure中AutoGen调用DeepSeek时的InternalServerError 500

解决AutoGen连接Azure OpenAI服务时的InternalServerError问题

运行以下Python代码调用Azure上部署的DeepSeek-R1模型时,触发500内部服务器错误:

import os
from autogen import AssistantAgent, UserProxyAgent
llm_config = { "config_list": [          {
            "model": "DeepSeek-R1",  
            "api_key": "XXX",  
            "base_url": "https://aistudioaiservicesXXXX.openai.azure.com/",
            "api_type": "azure",
            "api_version": "2024-05-01-preview"  # Adaptez selon votre configuration
        }] }
assistant = AssistantAgent("assistant", llm_config=llm_config)
user_proxy = UserProxyAgent("user_proxy", code_execution_config=False)
user_proxy.initiate_chat(
    assistant,
    message="Tell me a joke about NVDA and TESLA stock prices.",
)

错误信息:

InternalServerError: Error code: 500 - {'error': {'code': 'InternalServerError', 'message': 'Backend returned unexpected response. Please contact Microsoft for help.'}}

可按以下步骤排查解决:

  • 验证模型部署与配置匹配
    确认Azure门户中部署的模型名称与代码里的model字段完全一致,注意大小写和拼写错误;尝试将api_version切换为稳定版本(如2024-02-15-preview2023-12-01-preview),部分预览版API可能与DeepSeek-R1存在兼容性问题。

  • 核对API访问权限与密钥
    检查api_key是否为对应Azure OpenAI资源的有效密钥(可在门户“密钥和终结点”页面获取),避免密钥过期或输入错误;若资源设置了虚拟网络访问限制,需确保运行代码的环境在允许的网络范围内。

  • 测试基础API连通性
    先绕过AutoGen框架,用OpenAI SDK直接测试模型连通性,定位问题是否出在框架层面:

    from openai import AzureOpenAI
    client = AzureOpenAI(
        api_key="XXX",
        api_version="2024-02-15-preview",
        azure_endpoint="https://aistudioaiservicesXXXX.openai.azure.com/"
    )
    response = client.chat.completions.create(
        model="DeepSeek-R1",
        messages=[{"role": "user", "content": "Tell me a joke about NVDA and TESLA stock prices."}]
    )
    print(response.choices[0].message.content)
    

    若此测试仍报错,说明问题源于Azure服务端或配置,需联系Azure支持;若测试成功,再排查AutoGen的配置细节。

  • 更新AutoGen版本
    安装最新稳定版AutoGen,旧版本可能对Azure OpenAI的新API支持不足:

    pip install --upgrade pyautogen
    
  • 检查模型部署状态与配额
    登录Azure门户查看模型部署状态是否为“成功”,确认是否存在令牌配额耗尽、并发请求超限等资源限制问题。

内容的提问来源于stack exchange,提问作者user29762460

火山引擎 最新活动